¿Cómo realizar una prueba de arranque para comparar las medias de dos muestras?

12

Tengo dos muestras muy sesgadas y estoy tratando de usar bootstrapping para comparar sus medias usando la estadística t.

¿Cuál es el procedimiento correcto para hacerlo?


El proceso que estoy usando

Me preocupa la conveniencia de utilizar el error estándar de los datos originales / observados en el paso final cuando sé que esto no se distribuye normalmente.

Aquí están mis pasos:

  • Bootstrap: muestra aleatoria con reemplazo (N = 1000)
  • Calcule la estadística t para cada arranque para crear una distribución t :
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/n
  • Estime los intervalos de confianza t obteniendo los percentiles y 1 - α / 2 de la distribución tα/21α/2
  • Obtenga intervalos de confianza a través de:

    CIL=(X¯1X¯2)T_CIL.SEoriginal
    CIU=(X¯1X¯2)+T_CIU.SEoriginal
    SE=σX12/n+σX22/n
  • Mire dónde caen los intervalos de confianza para determinar si hay una diferencia significativa en las medias (es decir, no es cero)

También he analizado la suma de rango de Wilcoxon, pero no está dando resultados muy razonables debido a la distribución muy sesgada (por ejemplo, el percentil 75 == 95). Por esta razón, me gustaría explorar más la prueba t de arranque.

Entonces mis preguntas son:

  1. ¿Es esta una metodología apropiada?
  2. ¿Es apropiado usar el SE de los datos observados cuando sé que está muy sesgado?

Posible duplicado: ¿Qué método se prefiere, una prueba de arranque o una prueba no paramétrica basada en el rango?

GatosLoveJazz
fuente
¿Qué tan grandes son las muestras?
Michael M
@Michael Mayer Alrededor de 800
CatsLoveJazz
Ver también stats.stackexchange.com/questions/189587
dice Reinstate Monica

Respuestas:

16

Simplemente haría una prueba de arranque regular:

  • calcule la estadística t en sus datos y almacénela
  • cambiar los datos de modo que la hipótesis nula sea verdadera. En este caso, reste la media en el grupo 1 para el grupo 1 y sume la media general, y haga lo mismo para el grupo 2, de esa manera las medias en ambos grupos serán la media general.
  • Tome muestras de bootstrap de este conjunto de datos, probablemente del orden de 20,000.
  • calcule la estadística t en cada una de estas muestras de bootstrap. La distribución de estas estadísticas t es la estimación de arranque de la distribución de muestreo de la estadística t en los datos sesgados si la hipótesis nula es verdadera.
  • p(+1)(+1)

Puedes leer más sobre eso en:

  • Capítulo 4 de AC Davison y DV Hinkley (1997) Bootstrap Methods y su aplicación . Cambridge: Cambridge University Press.

  • Capítulo 16 de Bradley Efron y Robert J. Tibshirani (1993) Una introducción a Bootstrap . Boca Ratón: Chapman & Hall / CRC.

  • Entrada de Wikipedia sobre pruebas de hipótesis de bootstrap.

Maarten Buis
fuente
Esto es esencialmente lo que estoy haciendo, pero mirando la proporción de veces que la estadística t original / observada es> = estadística t inicializada. Sin embargo, ¿está bien hacer una prueba t en datos muy sesgados en primera instancia? Esta es una de las razones por las que quiero hacer un boostrap.
CatsLoveJazz
2
Técnicamente, para la prueba de arranque solo necesita una estadística de prueba para que no sea un problema. Sustancialmente, una prueba t compara las medias y, en las medianas de datos asimétricas, a menudo son más significativas que las medias. Por lo tanto, una prueba que compara medianas en lugar de medias puede tener más sentido. Sin embargo, eso depende de su hipótesis nula, que es su elección y solo su elección.
Maarten Buis
Ok, gracias, es el medio que queremos probar, ya que todos nuestros otros resultados han sido en esta forma.
CatsLoveJazz