¿Qué es el modelo nulo en regresión y cómo se relaciona con la hipótesis nula?

16

¿Qué es el modelo nulo en regresión y cuál es la relación entre el modelo nulo y la hipótesis nula?

Para mi entender, ¿significa

  • ¿Usando el "promedio de la variable de respuesta" para predecir la variable de respuesta continua?
  • ¿Usando la "distribución de etiquetas" en la predicción de variables de respuesta discretas?

Si ese es el caso, parece que faltan las conexiones entre la hipótesis nula.

Haitao Du
fuente
44
Tenga en cuenta que en R puede probar fit = lm(formula = y ~ 1, data) y debería ver la media de y. Además, vea la respuesta de MorganBall. Estaría más de acuerdo con su respuesta. Además, un modelo nulo puede ser un modelo con predictores , con un modelo alternativo que es uno con p + k , donde k puede ser 1,2, ... covariables adicionales. pp+k
Jon
3
Aquí hay una referencia para usted: onlinecourses.science.psu.edu/stat501/node/295
Jon

Respuestas:

11

No, yo diría que "modelo nulo" tiene esencialmente el mismo significado que "hipótesis nula": el modelo si la hipótesis nula es verdadera. Lo que esto significa, en un caso particular, por supuesto depende de la hipótesis nula concreta.

Sus interpretaciones como "el valor promedio" (probablemente quiera decir "la distribución marginal en la variable de respuesta") sin tener en cuenta ningún predictor, es una posibilidad, que corresponde a la hipótesis nula de una "prueba general", probando todos los parámetros (excepto la intersección) simultáneamente.

Pero el interés bien podría centrarse en un modelo de la forma donde x 1 contiene los predictores que sabe que están afectando el resultado, por lo que no quieren para probar, mientras que x 2 contiene los predictores que está probando.

yi=β0+β1Tx1i+β2Tx2i+ϵi
x1x2

Entonces la hipótesis nula será y el modelo nulo sería y i = β 0 + β T 1 x 1 i + ϵ iβ2=0yi=β0+β1Tx1i+ϵi . Entonces eso depende.

kjetil b halvorsen
fuente
2
La hipótesis nula suele ser algo específico sobre los valores de los parámetros; Yo diría que el modelo nulo sería la hipótesis nula más todos los supuestos que lo acompañan bajo los cuales se derivaría la distribución nula del estadístico de prueba : son los supuestos que contienen la mayor parte del modelo. Por ejemplo, la hipótesis nula no menciona la independencia, pero definitivamente diría que es parte del modelo nulo.
Glen_b -Reinstalar Monica
18

Un modelo nulo está relacionado con una hipótesis nula. Tome el siguiente modelo univariante:

Y=α+β1X+ϵ

β1 es estadísticamente diferente de cero.

H0:β1=0

HA:β10

β1X del modelo lineal y nos quedaríamos con

Y=α+ϵ

¿Cuál es su modelo nulo y lo mismo que la media de Y.

Morgan Ball
fuente
1
Hasta el último punto, sí, eso es correcto. En R, puede ver esto comparando la intersección de lm(y ~ 1, data)y mean(y).
Jon
2
+1 ¡Buena respuesta Morgan! Me he tomado la libertad de editar tu notación un poco, porque parecía extraño.
Alexis
9

En la regresión como se describe parcialmente en las otras dos respuestas, el modelo nulo es la hipótesis nula de que todos los parámetros de regresión son 0. Por lo tanto, puede interpretar que esto dice que bajo la hipótesis nula no hay tendencia y la mejor estimación / predicción de un nuevo observación es la media que es 0 en el caso de no intercepción.

Michael R. Chernick
fuente
1
Esta respuesta me ayudó a comprender nulo = 0 en coeficientes (que no sean interceptar), ¡Gracias!
Haitao Du
1
Además, el modelo puede ser el único modelo de intercepción, en comparación con otro modelo.
D_Williams
1
+1, esta es una adición útil al hilo. Sin embargo, diría que este es un uso específico y muy restrictivo del término "modelo nulo". El término a menudo (la mayoría del tiempo, supongo) se usa más libremente.
gung