¿Se puede usar bootstrap para reemplazar las pruebas no paramétricas?

15

Soy bastante nuevo en las estadísticas. El concepto de bootstrapping me ha resultado confuso.

Sé que se requiere la normalidad de la distribución de muestreo para usar ciertas pruebas, como la prueba t. En los casos en que los datos no se distribuyen normalmente, al solicitar "bootstrapping" en pruebas t en SPSS, ¿esto evitaría el problema de la no normalidad? Si es así, ¿la estadística t que se informa en la salida se basa en la distribución de muestreo bootstrap?

Además, ¿sería esta una mejor prueba en comparación con el uso de pruebas no paramétricas como Mann-Whitney o Kruskal-Wallis en los casos en que tengo datos no normales? En situaciones en que los datos no son normales y estoy usando bootstrap, no reportaría la estadística t: ¿verdad?

JC22
fuente

Respuestas:

16

El programa de arranque funciona sin necesidad de suposiciones como la normalidad, pero puede ser muy variable cuando el tamaño de la muestra es pequeño y la población no es normal. Por lo tanto, puede ser mejor en el sentido de que los supuestos se mantengan, pero no es mejor en todos los sentidos.

Las muestras de bootstrap con reemplazo, muestra de pruebas de permutación sin reemplazo. Las pruebas de Mann-Whitney y otras pruebas no paramétricas son en realidad casos especiales de la prueba de permutación. De hecho, prefiero la prueba de permutación aquí porque puede especificar una estadística de prueba significativa.

La decisión sobre qué prueba usar debe basarse en la pregunta que se responde y el conocimiento sobre la ciencia que conduce a los datos. El Teorema del límite central nos dice que todavía podemos obtener muy buenas aproximaciones de las pruebas t, incluso cuando la población no es normal. Lo buenas que sean las aproximaciones depende de la forma de la distribución de la población (no de la muestra) y del tamaño de la muestra. Hay muchos casos en los que una prueba t todavía es razonable para muestras más pequeñas (y algunos casos en los que no es lo suficientemente buena en muestras muy grandes).

Greg Snow
fuente
Gracias eso es útil. Entonces, si uso bootstrapping, solo informaría el valor p y el CI sin ninguna estadística de prueba, ¿es esto correcto?
JC22
(+1) ¿Tendría una referencia o un enlace con respecto a Mann-Whitney y las pruebas de permutación? ¡Eso es muy interesante pero no obvio para mí!
Gala
44
@ JC22 Debe informar una estadística de prueba (cualquiera que sea la estadística que arranque); una prueba de arranque basada en una media será diferente de una basada en una media recortada, por ejemplo.
Glen_b -Reinstate a Monica el
2
@ GaëlLaurans Para ver un ejemplo de generación de la distribución exacta (permutación) de la estadística de prueba de suma de rango de Wilcoxon (equivalente a Mann-Whitney) y de la estadística de prueba de Kruskal-Wallis, vea esta respuesta .
caracal
2
@ GaëlLaurans, en referencia es: Diferentes resultados de la prueba de Wilcoxon-Mann-Whitney de diferentes paquetes de estadísticas Reinhard Bergmann, John Ludbrook & Will PJM Spooren Journal: The American Statistician Volumen 54, Número 1, febrero de 2000, páginas 72-77
Greg Snow