(ACTUALIZACIÓN: profundicé en esto y publiqué los resultados aquí )
La lista de pruebas estadísticas con nombre es enorme. Muchas de las pruebas comunes se basan en la inferencia de modelos lineales simples, por ejemplo, una prueba t de una muestra es solo y = β + ε que se prueba contra el modelo nulo y = μ + ε, es decir, que β = μ donde μ es algo nulo valor - típicamente μ = 0.
Considero que esto es bastante más instructivo para propósitos de enseñanza que aprender de memoria modelos con nombre, cuándo usarlos y sus suposiciones como si no tuvieran nada que ver entre sí. Ese enfoque promueve no promueve la comprensión. Sin embargo, no puedo encontrar un buen recurso para recopilar esto. Estoy más interesado en las equivalencias entre los modelos subyacentes que en el método de inferencia de ellos. Aunque, por lo que puedo ver, las pruebas de razón de probabilidad en todos estos modelos lineales arrojan los mismos resultados que la inferencia "clásica".
Aquí están las equivalencias que he aprendido hasta ahora, ignorando el término de error y suponiendo que todas las hipótesis nulas son la ausencia de un efecto:
Prueba t de una muestra: .
Prueba t de muestra emparejada:
Esto es idéntico a una prueba t de una muestra sobre diferencias por pares.
Prueba t de dos muestras:
donde x es un indicador (0 o 1).
Correlación de Pearson:
Observe la similitud con una prueba t de dos muestras que es solo una regresión en un eje x binario.
Correlación de Spearman:
Esto es idéntico a una correlación de Pearson en x e y transformados por rango.
ANOVA unidireccional:
donde son indicadores que seleccionan la relevante (una es 1; las otras son 0). El modelo probablemente podría ser escrita en forma de matriz como como .
ANOVA de dos vías:
para dos factores de dos niveles. Aquí son vectores de betas donde uno es seleccionado por el vector indicador . El muestra aquí es el efecto de interacción.
¿Podríamos agregar más "pruebas con nombre" a esta lista de modelos lineales? Por ejemplo, ¿regresión multivariada, otras pruebas "no paramétricas", pruebas binomiales o ANOVA RM?
ACTUALIZACIÓN: se han hecho y respondido preguntas sobre ANOVA y las pruebas t como modelos lineales aquí en SO. Vea esta pregunta y las preguntas relacionadas etiquetadas .
fuente
x = rnorm(100); y = rnorm(100); summary(lm(rank(x) ~ rank(y))); cor.test(x, y, method='spearman')
Respuestas:
No es una lista exhaustiva, pero si incluye modelos lineales generalizados , el alcance de este problema se vuelve sustancialmente mayor.
Por ejemplo:
La prueba de tendencia de Cochran-Armitage puede formularse mediante:
La prueba de independencia Chi-Square de Pearson para una tabla de contingenciap×k es un modelo logarítmico lineal para las frecuencias de celda dado por:
Además, la prueba t para las variaciones desiguales se aproxima bien utilizando la estimación robusta de errores de Huber White.
fuente