Actualmente estoy tratando de abordar las infracciones de los supuestos de ANOVA. He usado Shapiro-Wilk para probar la normalidad, y he incursionado tanto en la prueba de Levene como en la prueba de igualdad de varianza de Bartlett. Desde entonces, log ha transformado mis datos para tratar de remediar las variaciones desiguales. Repasé la prueba de Bartlett en los datos transformados del registro, y aún recibí un valor p significativo, y por curiosidad también ejecuté la prueba de Levene y obtuve un valor p no significativo. ¿En qué prueba debo confiar?
Probablemente tampoco. Sería mejor mirar sus datos y ver qué tan graves son las violaciones. Los modelos lineales (p. Ej., ANOVA) son bastante robustos para infracciones menores cuando el grupo es igual. Una regla general para la heterocedasticidad es que la varianza máxima del grupo puede ser hasta 4 veces la varianza mínima del grupo sin demasiado daño para su análisis. Si le preocupa que pueda haber violaciones, un enfoque aún mejor es simplemente usar análisis que sean robustos a las posibles violaciones desde el principio, en lugar de tratar de detectar violaciones y luego tomar decisiones basadas en eso 1 . n
Para lo que vale, Wikipedia dice que la prueba de Bartlett es más sensible a las violaciones de la normalidad que la prueba de Levene. Por lo tanto, es posible que tenga datos no normales en lugar de datos heterocedásticos. Nuevamente, un análisis más robusto puede ser preferible 2 .
... bastante robusto a violaciones menores con Ns iguales.
John
Y luego está el problema de que podría tener una buena razón para creer que las muestras provienen de poblaciones con variaciones aproximadamente iguales ... En eso se basan las pruebas de robustez.
John
¿Puedo verificar visualmente el rango de variaciones usando diagramas de diagnóstico?
Clarice
Claro, @Clarice. Cualquier número de parcelas ayudará con eso. Puede hacer un diagrama de dispersión con los puntos dispuestos verticalmente dentro de los niveles de categoría marcados en el eje x, luego puede ver cómo se comparan. También puedes probar boxplots, por ejemplo.
gung - Restablece a Monica
4
Para una prueba menos sensible para condiciones no normales que la prueba de Levene, al menos a veces use la prueba de Conover, la prueba no paramétrica de rangos cuadrados AKA. He encontrado que esto es al menos a veces preferido para la prueba de Bartlett en la implementación de Mathematica de la Prueba de Equivalencia de Varianza .
Aquí hay una lista de métodos de prueba de varianza y supuestos copiados del enlace de Equivalencia de Varianza arriba
Bartlett normality modified likelihood ratio test
BrownForsythe robust robust Levene test
Conover symmetry Conover's squared ranks test
FisherRatio normality based on variance ratio
Levene robust,symmetry compares individual and group variances
Lo que debería ser obvio de esa lista es que las violaciones de los supuestos son comprobables, aunque la documentación de Mathematica no es específica en cuanto a cómo, por ejemplo, se realiza la prueba de simetría de Conover, o incluso por qué se prueba la simetría. Y, hasta ahora, nadie ha respondido a esa pregunta .
Entonces, la respuesta a la pregunta de OP es que solo las pruebas de condiciones pueden sugerir qué método es preferible en un caso particular. Además, si se intentan las 5 pruebas y no se excluyen debido a la violación de los supuestos, generalmente se puede distinguir entre respuestas mejores y peores con las respuestas que se generen.
Como peor de los casos, uno puede realizar la simulación de Monte Carlo utilizando valores de verdad conocidos para explorar qué condiciones conducen a qué probabilidades. Pero, sin más información sobre el problema en sí, la pregunta no puede responderse en términos del conjunto de datos del OP. Si el OP quiere una respuesta específica orientada a datos, proporcione los datos.
La prueba de Conover es una sugerencia razonable aquí. Pero no debe mezclar una respuesta a esta pregunta con una nueva pregunta propia y una solicitud de comentarios (¿de quién?) Con respecto a partes de su respuesta, o pedir que se apruebe su edición sugerida.
gung - Restablece a Monica
@gung Sí bien, lo cambié para que sea más útil de inmediato.
Para una prueba menos sensible para condiciones no normales que la prueba de Levene, al menos a veces use la prueba de Conover, la prueba no paramétrica de rangos cuadrados AKA. He encontrado que esto es al menos a veces preferido para la prueba de Bartlett en la implementación de Mathematica de la Prueba de Equivalencia de Varianza .
Aquí hay una lista de métodos de prueba de varianza y supuestos copiados del enlace de Equivalencia de Varianza arriba
Lo que debería ser obvio de esa lista es que las violaciones de los supuestos son comprobables, aunque la documentación de Mathematica no es específica en cuanto a cómo, por ejemplo, se realiza la prueba de simetría de Conover, o incluso por qué se prueba la simetría. Y, hasta ahora, nadie ha respondido a esa pregunta .
Entonces, la respuesta a la pregunta de OP es que solo las pruebas de condiciones pueden sugerir qué método es preferible en un caso particular. Además, si se intentan las 5 pruebas y no se excluyen debido a la violación de los supuestos, generalmente se puede distinguir entre respuestas mejores y peores con las respuestas que se generen.
Como peor de los casos, uno puede realizar la simulación de Monte Carlo utilizando valores de verdad conocidos para explorar qué condiciones conducen a qué probabilidades. Pero, sin más información sobre el problema en sí, la pregunta no puede responderse en términos del conjunto de datos del OP. Si el OP quiere una respuesta específica orientada a datos, proporcione los datos.
fuente