Estoy analizando un conjunto de datos experimentales. Los datos consisten en un vector emparejado de tipo de tratamiento y un resultado binomial:
Treatment Outcome
A 1
B 0
C 0
D 1
A 0
...
En la columna de resultados, 1 denota un éxito y 0 denota un fracaso. Me gustaría saber si el tratamiento varía significativamente el resultado. Hay 4 tratamientos diferentes con cada experimento repetido una gran cantidad de veces (2000 para cada tratamiento).
Mi pregunta es, ¿puedo analizar el resultado binario usando ANOVA? ¿O debería usar una prueba de chi-cuadrado para verificar los datos binomiales? Parece que chi-cuadrado supone que la proporción se dividiría en partes iguales, lo cual no es el caso. Otra idea sería resumir los datos usando la proporción de éxitos versus fracasos para cada tratamiento y luego usar una prueba de proporción.
Tengo curiosidad por escuchar sus recomendaciones para las pruebas que tienen sentido para este tipo de experimentos binomiales de éxito / fracaso.
Tal vez algunos lo consideren anticuado, pero si solo desea probar la hipótesis nula de que todos los grupos tienen la misma probabilidad de éxito, entonces puede definir como número de éxitos en el grupo , como número de ensayos en el grupo , el estimado la probabilidad en el grupo será , y luego usará la transformación estabilizadora de varianza para el binomio, que es Tal enfoque fue (a veces ) lo suficientemente bueno para Fisher, ¡así que puede ser útil también hoy!Xk k nortek k k pags^k= Xk/ nk
Sin embargo, algunos autores modernos son bastante escépticos sobre la transformación del arcoseno, ver por ejemplo http://www.mun.ca/biology/dschneider/b7932/B7932Final10Dec2010.pdf Pero a estos autores les preocupan problemas como la predicción, donde muestran El arcoseno puede provocar problemas. Si solo le preocupan las pruebas de hipótesis, debería estar bien. Un enfoque más moderno podría usar la regresión logística.
fuente
Me gustaría diferir de lo que piensas sobre la prueba Chi-Sq. Es aplicable incluso si los datos no son binomiales. Se basa en la normalidad asintótica de mle (en la mayoría de los casos).
Haría una regresión logística como esta:
dónde
Es el equivalente ANOVA si hay una relación o no.
Es la prueba es A tiene algún efecto.
Es la prueba es B tiene algún efecto.
Es la prueba es C tiene algún efecto.
Ahora puede hacer más contrastes para encontrar lo que le interesa. Todavía es una prueba de chi-sq, pero con diferentes grados de libertad (3, 1, 1 y 1, respectivamente)
fuente
Creo que tiene razón en que ANOVA no debe usarse para analizar la variable dependiente binomial. Muchas personas usan esto para comparar las medias de la variable de respuesta binaria (0 1), pero no se debe usar porque esto viola gravemente el supuesto de normalidad y varianza igual. Las pruebas de Chi-cuadrado o la regresión logística son las mejores para estas situaciones.
fuente