Antecedentes
Para analizar las diferencias en alguna variable continua entre diferentes grupos (dada por una variable categórica), se puede realizar un ANOVA unidireccional. Si hay varias variables explicativas (categóricas), se puede realizar un ANOVA factorial. Si se desea analizar las diferencias entre grupos en varias variables continuas (es decir, varias variables de respuesta), se debe realizar un ANOVA multivariado (MANOVA).
Pregunta
Apenas entiendo cómo se puede realizar una prueba similar a ANOVA en varias variables de respuesta y, lo que es más importante, no entiendo cuál podría ser la hipótesis nula. Es la hipótesis nula:
- "Para cada variable de respuesta, las medias de todos los grupos son iguales",
O es eso
- "Para al menos una variable de respuesta, las medias de todos los grupos son iguales",
o es otra cosa?
hypothesis-testing
anova
manova
Remi.b
fuente
fuente
H0
de MANOVA es que no hay diferencia en el espacio multivariante . El caso multivariante es considerablemente más complejo que el univariante porque tenemos que lidiar con covarianzas, no solo variaciones. Existen varias formas de formular lasH0-H1
hipótesis en MANOVA. Leer WikipediaFor each response variable
. Para mí, suena como (o lo leo como) "la prueba se realiza de forma univariet en cada uno" (y luego de alguna manera combinada).Respuestas:
La hipótesis nula de un ANOVA unidireccional es que las medias de todos los grupos son iguales:La hipótesis nula de un MANOVA unidireccional es que los medios [multivariados] de todos los grupos son iguales:Esto equivale a decir que las medias son iguales para cada variable de respuesta, es decir, su primera opción es correcta .H 0 : μ 1 = μ 2 = . . . = μ k . H 0H0
En ambos casos, la hipótesis alternativa es la negación de la nula. En ambos casos, las suposiciones son (a) distribuciones gaussianas dentro del grupo y (b) varianzas iguales (para ANOVA) / matrices de covarianza (para MANOVA) entre grupos.H1
Diferencia entre MANOVA y ANOVA
Esto puede parecer un poco confuso: la hipótesis nula de MANOVA es exactamente la misma que la combinación de hipótesis nulas para una colección de ANOVA univariados, pero al mismo tiempo sabemos que hacer MANOVA no es equivalente a hacer ANOVA univariados y luego de alguna manera " combinando "los resultados (se podrían encontrar varias formas de combinar). Por qué no?
La respuesta es que ejecutar todos los ANOVA univariantes, aunque probaría la misma hipótesis nula, tendrá menos poder. Vea mi respuesta aquí para ver una ilustración: ¿Cómo puede MANOVA informar una diferencia significativa cuando ninguno de los ANOVA univariados alcanza importancia? El método ingenuo de "combinar" (rechazar el valor nulo global si al menos un ANOVA rechaza el valor nulo) también conduciría a una gran inflación de la tasa de error tipo I; pero incluso si uno elige alguna forma inteligente de "combinar" para mantener la tasa de error correcta, uno perdería poder.
Cómo funciona la prueba
ANOVA descompone la suma total de cuadrados en entre grupos de suma de cuadrados y dentro de los grupos de suma de cuadrados , de manera que . A continuación, calcula la relación de . Bajo la hipótesis nula, esta relación debería ser pequeña (alrededor de ); se puede calcular la distribución exacta de esta relación esperada según la hipótesis nula (dependerá de del número de grupos). Al comparar el valor observado con esta distribución se obtiene un valor p.T B W T=B+W B/W 1 n B/W
MANOVA descompone la dispersión total de la matriz en entre grupos de dispersión matriz y dentro de los grupos de dispersión matriz , de modo que . Se calcula entonces la matriz . Bajo la hipótesis nula, esta matriz debería ser "pequeña" (alrededor de ); pero ¿cómo cuantificar cuán "pequeño" es? MANOVA analiza los valores propios de esta matriz (todos son positivos). Nuevamente, bajo la hipótesis nula, estos valores propios deberían ser "pequeños" (alrededor deT B W T=B+W W−1B I λi 1 ) Pero para calcular un valor p, necesitamos un número (llamado "estadística") para poder compararlo con su distribución esperada bajo nulo. Hay varias formas de hacerlo: tome la suma de todos los valores propios ; tome el valor propio , etc. En cada caso, este número se compara con la distribución de esta cantidad esperada bajo el valor nulo, lo que da como resultado un valor p.∑λi max{λi}
Las diferentes elecciones del estadístico de prueba conducen a valores p ligeramente diferentes, pero es importante darse cuenta de que en cada caso se está probando la misma hipótesis nula.
fuente
SSdifference/SSerror
escalar. En MANOVA, el efecto multivariante esSSCPerror^(-1)SSCPdifference
matriz (covarianzas totales y dentro de los grupos contabilizados). Pero dado que hay varios valores propios que podrían "combinarse" no de una sola manera en una estadística de prueba, existen varias hipótesis alternativas posibles. Más potencia, más complejidad teórica.Es lo primero.
Sin embargo, la forma en que lo hace no es, literalmente, comparar las medias de cada una de las variables originales. En cambio, las variables de respuesta se transforman linealmente de una manera muy similar al análisis de componentes principales . (Aquí hay un excelente hilo sobre PCA: dar sentido al análisis de componentes principales, vectores propios y valores propios ). La diferencia es que PCA orienta sus ejes para alinearse con las direcciones de máxima variación, mientras que MANOVA gira sus ejes en las direcciones que maximiza la separación de tus grupos.
Sin embargo, para ser claros, ninguna de las pruebas asociadas con un MANOVA está probando todos los medios uno tras otro en un sentido directo, ya sea con los medios en el espacio original o en el espacio transformado. Hay varias estadísticas de prueba diferentes que funcionan de manera ligeramente diferente, sin embargo, tienden a operar sobre los valores propios de la descomposición que transforma el espacio. Pero en lo que respecta a la naturaleza de la hipótesis nula, es que todos los medios de todos los grupos son iguales en cada variable de respuesta, no es que puedan diferir en algunas variables sino que son iguales en al menos una.
fuente