¿Cuál es la hipótesis nula de un MANOVA?

11

Antecedentes

Para analizar las diferencias en alguna variable continua entre diferentes grupos (dada por una variable categórica), se puede realizar un ANOVA unidireccional. Si hay varias variables explicativas (categóricas), se puede realizar un ANOVA factorial. Si se desea analizar las diferencias entre grupos en varias variables continuas (es decir, varias variables de respuesta), se debe realizar un ANOVA multivariado (MANOVA).

Pregunta

Apenas entiendo cómo se puede realizar una prueba similar a ANOVA en varias variables de respuesta y, lo que es más importante, no entiendo cuál podría ser la hipótesis nula. Es la hipótesis nula:

  • "Para cada variable de respuesta, las medias de todos los grupos son iguales",

O es eso

  • "Para al menos una variable de respuesta, las medias de todos los grupos son iguales",

o es otra cosa?H0

Remi.b
fuente
No puedo decir, ¿también estás preguntando cómo funciona un ANOVA? En el contexto de discutir qué es un error estándar, esencialmente explico la idea básica detrás de un ANOVA aquí: ¿Cómo funciona el error estándar?
gung - Restablece a Monica
Ninguna de tus dos declaraciones. H0de MANOVA es que no hay diferencia en el espacio multivariante . El caso multivariante es considerablemente más complejo que el univariante porque tenemos que lidiar con covarianzas, no solo variaciones. Existen varias formas de formular las H0-H1hipótesis en MANOVA. Leer Wikipedia
ttnphns
@ttnphns: ¿Por qué tampoco? La de ANOVA es que las medias de todos los grupos son iguales. La de MANOVA es que los medios multivariados de todos los grupos son iguales. Esta es exactamente la alternativa 1 en el OP. Las covarianzas, etc., ingresan los supuestos y los cálculos de MANOVA, no la hipótesis nula. H 0H0H0
ameba dice Reinstate Monica
@amoeba, no me gustó For each response variable. Para mí, suena como (o lo leo como) "la prueba se realiza de forma univariet en cada uno" (y luego de alguna manera combinada).
ttnphns

Respuestas:

9

La hipótesis nula de un ANOVA unidireccional es que las medias de todos los grupos son iguales:La hipótesis nula de un MANOVA unidireccional es que los medios [multivariados] de todos los grupos son iguales:Esto equivale a decir que las medias son iguales para cada variable de respuesta, es decir, su primera opción es correcta .H 0 : μ 1 = μ 2 = . . . = μ k . H 0H0

H0:μ1=μ2=...=μk.
H0
H0:μ1=μ2=...=μk.

En ambos casos, la hipótesis alternativa es la negación de la nula. En ambos casos, las suposiciones son (a) distribuciones gaussianas dentro del grupo y (b) varianzas iguales (para ANOVA) / matrices de covarianza (para MANOVA) entre grupos.H1

Diferencia entre MANOVA y ANOVA

Esto puede parecer un poco confuso: la hipótesis nula de MANOVA es exactamente la misma que la combinación de hipótesis nulas para una colección de ANOVA univariados, pero al mismo tiempo sabemos que hacer MANOVA no es equivalente a hacer ANOVA univariados y luego de alguna manera " combinando "los resultados (se podrían encontrar varias formas de combinar). Por qué no?

La respuesta es que ejecutar todos los ANOVA univariantes, aunque probaría la misma hipótesis nula, tendrá menos poder. Vea mi respuesta aquí para ver una ilustración: ¿Cómo puede MANOVA informar una diferencia significativa cuando ninguno de los ANOVA univariados alcanza importancia? El método ingenuo de "combinar" (rechazar el valor nulo global si al menos un ANOVA rechaza el valor nulo) también conduciría a una gran inflación de la tasa de error tipo I; pero incluso si uno elige alguna forma inteligente de "combinar" para mantener la tasa de error correcta, uno perdería poder.

Cómo funciona la prueba

ANOVA descompone la suma total de cuadrados en entre grupos de suma de cuadrados y dentro de los grupos de suma de cuadrados , de manera que . A continuación, calcula la relación de . Bajo la hipótesis nula, esta relación debería ser pequeña (alrededor de ); se puede calcular la distribución exacta de esta relación esperada según la hipótesis nula (dependerá de del número de grupos). Al comparar el valor observado con esta distribución se obtiene un valor p.TBWT=B+WB/W1nB/W

MANOVA descompone la dispersión total de la matriz en entre grupos de dispersión matriz y dentro de los grupos de dispersión matriz , de modo que . Se calcula entonces la matriz . Bajo la hipótesis nula, esta matriz debería ser "pequeña" (alrededor de ); pero ¿cómo cuantificar cuán "pequeño" es? MANOVA analiza los valores propios de esta matriz (todos son positivos). Nuevamente, bajo la hipótesis nula, estos valores propios deberían ser "pequeños" (alrededor deTBWT=B+WW1BIλi1) Pero para calcular un valor p, necesitamos un número (llamado "estadística") para poder compararlo con su distribución esperada bajo nulo. Hay varias formas de hacerlo: tome la suma de todos los valores propios ; tome el valor propio , etc. En cada caso, este número se compara con la distribución de esta cantidad esperada bajo el valor nulo, lo que da como resultado un valor p.λimax{λi}

Las diferentes elecciones del estadístico de prueba conducen a valores p ligeramente diferentes, pero es importante darse cuenta de que en cada caso se está probando la misma hipótesis nula.

ameba dice reinstalar Monica
fuente
Además, si no corrige las pruebas múltiples, el enfoque de ANOVA totalmente univariante también generará una inflación de error tipo I.
gung - Restablece a Monica
1
@gung: Sí, eso también es cierto. Sin embargo, uno puede ser más inteligente al "combinar" que simplemente rechazar el nulo tan pronto como al menos uno de los ANOVA rechaza el nulo. Mi punto era que, por más inteligente que uno intente "combinarse", aún perderá poder en comparación con MANOVA (incluso si logra mantener el tamaño de la prueba sin inflar la tasa de error).
ameba dice Reinstate Monica
Pero, ¿no está ahora ese "poder" directamente relacionado con la noción de covarianza? La moraleja es que con una (serie de) pruebas univariadas, probamos solo el efecto marginal que es SSdifference/SSerrorescalar. En MANOVA, el efecto multivariante es SSCPerror^(-1)SSCPdifferencematriz (covarianzas totales y dentro de los grupos contabilizados). Pero dado que hay varios valores propios que podrían "combinarse" no de una sola manera en una estadística de prueba, existen varias hipótesis alternativas posibles. Más potencia, más complejidad teórica.
ttnphns
@ttnphns, sí, todo esto es correcto, pero creo que no cambia el hecho de que la hipótesis nula es lo que escribí (y de eso se trataba la pregunta). Cualquiera que sea el estadístico de prueba utilizado (Wilks / Roy / Pillai-Bartlett / Lawley-Hotelling), están tratando de probar la misma hipótesis nula. Podría ampliar mi respuesta más tarde para discutir esto con más detalle.
ameba dice Reinstate Monica
1
@gung me pidió que interviniera (no estoy seguro de por qué ... enseñé MANOVA hace unos 7 años, y nunca lo apliqué). Diría que la ameba tiene razón al decir que es una negación total de la nula , que es un hiperespacio - dimensional en el espacio dimensional de parámetros (si es la dimensión que nadie se molestó en definir hasta ahora) . Y es la opción 1 dada por el OP. La opción 2 es significativamente más difícil de probar. H1H0:μgroup 1==μgroup kpkpp
StasK
8

Es lo primero.

Sin embargo, la forma en que lo hace no es, literalmente, comparar las medias de cada una de las variables originales. En cambio, las variables de respuesta se transforman linealmente de una manera muy similar al análisis de componentes principales . (Aquí hay un excelente hilo sobre PCA: dar sentido al análisis de componentes principales, vectores propios y valores propios ). La diferencia es que PCA orienta sus ejes para alinearse con las direcciones de máxima variación, mientras que MANOVA gira sus ejes en las direcciones que maximiza la separación de tus grupos.

Sin embargo, para ser claros, ninguna de las pruebas asociadas con un MANOVA está probando todos los medios uno tras otro en un sentido directo, ya sea con los medios en el espacio original o en el espacio transformado. Hay varias estadísticas de prueba diferentes que funcionan de manera ligeramente diferente, sin embargo, tienden a operar sobre los valores propios de la descomposición que transforma el espacio. Pero en lo que respecta a la naturaleza de la hipótesis nula, es que todos los medios de todos los grupos son iguales en cada variable de respuesta, no es que puedan diferir en algunas variables sino que son iguales en al menos una.

gung - Restablece a Monica
fuente
Ooh ... ¿Entonces Manova hace un análisis discriminante lineal (para maximizar la distancia entre la media de los grupos) y luego, ejecuta una anova estándar usando el primer eje como variable de respuesta? Entonces, es "el medio - en términos de PC1 - de todos los grupos son iguales". ¿Está bien? Ho
Remi.b
Hay varias pruebas posibles diferentes. Probar solo el primer eje es esencialmente usar la raíz más grande de Roy como prueba. Esta suele ser la prueba más poderosa, pero también es más limitada. Supongo que hay una discusión en curso sobre qué prueba es la "mejor".
gung - Restablece a Monica
Supongo que usamos MANOVA en lugar de varios ANOVA para evitar múltiples problemas de prueba. Pero si, al hacer un MANOVA, solo hacemos un ANOVA en la PC1 de un LDR , entonces todavía tenemos que considerar un problema de pruebas múltiples al mirar el Pvalue. ¿Es esto correcto? (Espero que tenga más sentido.
Eliminé
Ese es un punto perspicaz, pero hay dos problemas: 1) los ejes ahora son ortogonales, y eso puede cambiar los problemas con pruebas múltiples; 2) las distribuciones de muestreo de las estadísticas de prueba MANOVA tienen en cuenta los múltiples ejes.
gung - Restablece a Monica
1
@ Remi.b: Estas son buenas preguntas, pero para ser claros: ¡MANOVA no es equivalente a un ANOVA en el primer eje discriminante de LDA! Vea aquí la relación entre MANOVA y LDA: ¿Cómo se relaciona MANOVA con LDA?
ameba dice Reinstate Monica