Estoy seguro de que tengo esto completamente envuelto alrededor de mi cabeza, pero no puedo entenderlo.
La prueba t compara dos distribuciones normales usando la distribución Z. Es por eso que hay una suposición de normalidad en los DATOS.
ANOVA es equivalente a la regresión lineal con variables ficticias, y usa sumas de cuadrados, al igual que OLS. Es por eso que hay una suposición de normalidad de los RESIDUALES.
Me ha llevado varios años, pero creo que finalmente he entendido esos hechos básicos. Entonces, ¿por qué la prueba t es equivalente a ANOVA con dos grupos? ¿Cómo pueden ser equivalentes si ni siquiera asumen las mismas cosas sobre los datos?
distributions
regression
normality-assumption
t-test
anova
Chris Beeley
fuente
fuente
Respuestas:
La prueba t con dos grupos supone que cada grupo se distribuye normalmente con la misma varianza (aunque las medias pueden diferir bajo la hipótesis alternativa). Eso es equivalente a una regresión con una variable ficticia ya que la regresión permite que la media de cada grupo difiera pero no la varianza. Por lo tanto, los residuos (igual a los datos con las medias del grupo restadas) tienen la misma distribución, es decir, normalmente se distribuyen con media cero.
Una prueba t con variaciones desiguales no es equivalente a un ANOVA unidireccional.
fuente
La prueba t simplemente es un caso especial de la prueba F donde solo se comparan dos grupos. El resultado de cualquiera será exactamente el mismo en términos del valor p y también existe una relación simple entre las estadísticas F y t. F = t ^ 2. Las dos pruebas son algebraicamente equivalentes y sus supuestos son los mismos.
De hecho, estas equivalencias se extienden a toda la clase de ANOVA, pruebas t y modelos de regresión lineal. La prueba t es un caso especial de ANOVA. ANOVA es un caso especial de regresión. Todos estos procedimientos están incluidos en el Modelo lineal general y comparten los mismos supuestos.
Puede pensar que es normalidad en los datos, pero está verificando la normalidad en cada grupo, que en realidad es lo mismo que verificar la normalidad en los residuos cuando el único predictor en el modelo es un indicador de grupo. Igualmente con variaciones iguales.
Por otro lado, R no tiene rutinas separadas para ANOVA. Las funciones anova en R son solo envoltorios de la función lm (), lo mismo que se usa para ajustar los modelos de regresión lineal, empaquetados de manera un poco diferente para proporcionar lo que normalmente se encuentra en un resumen ANOVA en lugar de un resumen de regresión.
fuente
lm()
, a menos que cambie a modelos mixtos con el paquetenlme
olme4
, pero hay una manera práctica de manejar mediciones repetidas a través de la especificación apropiada delError
término enaov()
, vea más detalles en el tutorial de Baron & Li, §6.9, j.mp/ c5ME4uaov()
está construido sobre lalm()
función pero incluye argumentos adicionales, llamados términos especiales , comoError
.Estoy totalmente de acuerdo con la respuesta de Rob, pero déjame decirlo de otra manera (usando wikipedia):
Suposiciones ANOVA :
Supuestos t-test :
Por lo tanto, rechazaría la pregunta, ya que obviamente tienen los mismos supuestos (aunque en un orden diferente :-)).
fuente
Un punto obvio que todo el mundo pasa por alto: con ANOVA está probando que la media es idéntica independientemente de los valores de sus variables explicativas. Con una prueba T también puede probar el caso unilateral, que la media es específicamente mayor dado un valor de su variable explicativa que el otro.
fuente
Preferiré usar la prueba t para comparar dos grupos y usaré ANOVA para más de 2 grupos, por razones. Una razón importante es la suposición de variaciones iguales.
fuente