¿Es incorrecto usar ANOVA en lugar de una prueba t para comparar dos medias?

Tengo una distribución de salarios y quiero comparar la diferencia de medias para hombres y mujeres. Sé que existe la prueba T de estudiante para comparar dos medias, pero después de sugerir ANOVA recibí algunas críticas diciendo que ANOVA es para comparar más de dos medias.

¿Qué (si algo) está mal al usarlo para comparar solo 2 medios?

hypothesis-testing anova t-test Pablo Fernández
fuente

¿Quién dice que está mal?

gung - Restablece a Monica

¿Por qué no reformulas la pregunta suprimiendo cualquier suposición? Algo parecido a "¿Es ANOVA equivalente a una prueba t cuando se comparan dos grupos?" Solo una idea ... No me haré responsable de cuán bienvenida sea la pregunta de cualquier manera :-)

Antoni Parellada

Alternativamente, modifique su pregunta para mostrar a alguien que dice que está mal ... para que podamos explicarle que está equivocado. La dificultad aquí es que la premisa de la pregunta (que está mal) está equivocada.

Glen_b -Reinstate Monica

Aunque la premisa es errónea, esta pregunta no parece estar fuera de tema o tan poco clara que no se puede responder (de hecho, se ha respondido). Creo que esto puede permanecer abierto.

gung - Restablecer Monica

De acuerdo, @ gung. Creo que la pregunta refleja una falta de conocimiento sobre el tema. Si fue redactado de manera diferente (o "mejor"), entonces la pregunta probablemente no se habría formulado porque entonces ya habrían sabido la respuesta.

D_Williams

Respuestas:

No está mal y será equivalente a una prueba que asume variaciones iguales. Además, con dos grupos, sqrt (f-statistic) es igual al (aboslute value of the) t-statistic. Estoy algo seguro de que una prueba t con variaciones desiguales no es equivalente. Dado que puede obtener estimaciones apropiadas cuando las variaciones son desiguales (las variaciones generalmente siempre son desiguales a algún lugar decimal), probablemente tenga sentido usar la prueba t, ya que es más flexible que un ANOVA (suponiendo que solo tenga dos grupos).

Actualizar:

Aquí hay un código para mostrar que la estadística t ^ 2 para la prueba t de varianza igual, pero no la prueba t desigual, es la misma que la estadística f.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

D_Williams
fuente

+1, tenga en cuenta que es posible ajustar una prueba ANOVA / F unidireccional para variaciones desiguales (cf. Alternativas a ANOVA unidireccional para datos heterocedasticos ).

gung - Restablecer Monica

@gung OK. No estaba seguro de esto, ya que no he usado ANOVA en algún momento (he estado haciendo lo Bayesiano).

D_Williams

Hay otra ventaja al realizar pruebas : si tiene una hipótesis direccional, puede realizar una prueba una cola ; ANOVA por otro lado siempre prueba hipótesis no direccionales.

t

$t$

t

$t$

crsh

Son equivalentes Un ANOVA con solo dos grupos es equivalente a una prueba t. La diferencia es que cuando tienes varios grupos, el error tipo I aumentará para las pruebas t, ya que no puedes probar la hipótesis de forma conjunta. ANOVA no sufre este problema, ya que los prueba conjuntamente mediante una prueba F.

robinsa
fuente

No creo que pierda poder, creo que tiene más que ver con los errores tipo I. En general, cuantas más pruebas tengas, mayor potencia deberías obtener.

HelloWorld

Creo (como dice @StudentT) que se trata de errores de tipo I, en un curso que estoy tomando nos están haciendo usar la "Corrección de Bonferroni" exactamente para esto. en.wikipedia.org/wiki/Bonferroni_correction

Pablo Fernandez

Sí, estás en lo correcto. No debe ser energía (tipo II) sino errores tipo I. Creo que el razonamiento es correcto, pero por alguna razón escribí poder y no error tipo 1. Lo editaré para asegurarme de no engañar a nadie.

robinsa