¿Cuál es la contraparte bayesiana de una prueba t de dos muestras con variaciones desiguales?

11

Estoy buscando la contraparte bayesiana de la prueba t de dos muestras con variaciones desiguales (la prueba de Welch). También estoy buscando una prueba multivariante, como la estadística T de Hotelling. Referencias apreciadas.

Para el caso multivariante, suponga que tenemos y ( z 1 , , z N ) , donde y i (resp z i ) es un acceso directo para una media muestral, desviación estándar muestral y número de puntos. Podemos suponer que el número de puntos es constante en todo el conjunto de datos, la desviación estándar es la misma para todos y i (resp z i ) y que la media muestral de y i (resp z i(y1,,yN)(z1,,zN)yiziyiziyizi) están correlacionados. Si traza las medias de muestra, se siguen entre sí y al conectarlas, obtiene una función variable suave. Ahora, en algunas partes, la función está de acuerdo con la función z , pero en otras no, porque m e a n ( y i ) - m e a n ( z i )yz vuelve grande. Me gustaría cuantificar esta afirmación. mean(yi)mean(zi)std(yi)+std(zi)

Yannick
fuente
He actualizado mi respuesta.
John Salvatier
Escribir "behrens fisher" en el cuadro de búsqueda conduce a información valiosa sobre el enfoque bayesiano de las dos muestras independientes con variaciones desiguales.
Stéphane Laurent

Respuestas:

6

Si bien puede hacer esto de una manera bayesiana, ¿ha considerado si realmente sería mejor estimar la diferencia en las medias en lugar de probar si son diferentes? Esto es lo que Andrew Gelman recomienda con frecuencia . Puedo imaginar algunas posibles razones para querer hacer una prueba de hipótesis, pero no creo que sean tan comunes.

No creo que necesite algo como una prueba t, porque puede estimar bien la desviación estándar porque dijo que los grupos tienen desviaciones estándar muy similares.

Si ese es el caso, creo que este enlace debería ser lo que necesita. Muestra cómo estimar una diferencia de medias o hacer una prueba de hipótesis (aunque no lo recomiendo). También puede echar un vistazo a la parte a la que hacen referencia en el libro de Bolstad (puede encontrar copias electrónicas en línea). También es posible incorporar la estimación de las variaciones, pero es más complejo, por lo que sospecho que es mejor incorporar la información previa que tiene sobre las variaciones de una manera ingenua (por ejemplo, utilizando el estimador de Stdev imparcial en cada uno de los conjuntos y luego promediarlos y fingir que son tus stdevs 'conocidos').

John Salvatier
fuente
Sí, pero eso lleva a otro problema. ¿Cómo puede saber si la diferencia en las medias es realmente significativa? Lo compararía con la suma de la SD de cada muestra, pero eso no es muy riguroso.
Yannick
@yannick: "significativo", estadísticamente o en el mundo real?
Wayne
@Wayne mundo real, supongo.
Yannick
3
@yannick: La importancia del mundo real es un problema de conocimiento de dominio, no uno estadístico. Es decir, puedo decirle que tengo algunos datos de peso y que hay una diferencia estadísticamente significativa de 10 gramos en los pesos medios entre dos grupos, al nivel del 95%, pero ¿eso tiene importancia en el mundo real? Para un pez pequeño, sí, para hombres adultos, no. Si habla de importancia en el mundo real, me imagino que comparar con SD o determinar cuantiles respondería a su pregunta incluso si eso no parece riguroso y deja espacio para que alguien no esté de acuerdo con usted.
Wayne
m1m2s1+s2
12

John Kruschke ha desarrollado una rutina bayesiana que se entiende como una caída en el reemplazo de la prueba t de dos muestras. La rutina se llama BEST (Estimación Bayesiana Reemplaza a la prueba T) y se describe aquí . También hice una versión de JavaScript en línea que se ejecuta en el navegador disponible aquí .

Rasmus Bååth
fuente