¿Cuál es la relación entre la función y la regresión lineal?

9

Considera la función

r(X)=mi(YX=X)

Esto se ha llamado la función de regresión en un libro de texto que estoy usando. Estoy tratando de descubrir la relación entre esta función y el modelo clásico de regresión lineal.

Entonces, sé que es un teorema * que podemos escribir

Y=r(X)+ϵ

para alguna variable aleatoria st .ϵmi(ϵ)=0 0

Ahora supongamos que tenemos

Y=β0 0+β1X+ϵ

Esta es la función de regresión unidimensional clásica (suponiendo que y minimizan la suma residual de cuadrados).β0 0β1

Pregunta: ¿Es entonces un teorema matemático que si se define como anteriormente, queY

r(X)=mi(YX)=(β0 0+β1X)?

Y es esta la razón por la función se llama la "función de regresión"?E(YX)

EDITAR: El teorema que estoy utilizando es el siguiente (de All of Statistics pág. 89):

Los modelos de regresión a veces se escriben como

Y=r(X)+ϵ

donde . Siempre podemos reescribir un modelo de regresión de esta manera. Para ver esto, defina y, por lo tanto, . Además, .E(ϵ)=0ϵ=Yr(X)Y=Y+r(X)r(X)=r(X)+ϵE(ϵ)=EE(ϵX)=E(E(Yr(X))X)=E(E(YX)r(X))=E(r(X)r(X))=0

Jorge
fuente
1
La conexión es que un modelo de regresión lineal es exactamente la afirmación de que es una función lineal de algunas X observadas. Naturalmente, esta afirmación no necesita ser cierta, aunque como aproximación a puede ser mejor o peor. El capítulo de 'Econometría mayormente inofensiva' llamado 'Hacer que la regresión tenga sentido' es una buena discusión. rr
conjugateprior
¿O me he perdido lo que estabas preguntando?
conjugateprior
Verifique la respuesta relacionada: stats.stackexchange.com/questions/173660/…
Tim

Respuestas:

9

Resumiendo la pregunta:

Dado Y=β0+β1X+ε, ¿es entonces un teorema matemático que r(X)=E(YX)=(β0+β1X)?

Sí, por propiedades básicas de expectativa:

mi(YX)=mi(β0 0+β1X+ε)=mi(β0 0)+mi(β1X)+mi(ε)(linealidad de la expectativa)=β0 0+β1X+0 0(Señalando que X es constante aquíporque lo condicionamos)=β0 0+β1X

Las razones históricas para que la regresión se llame regresión se relacionan con Galton al notar el efecto de " regresión a la media ", inicialmente en un experimento en plantas que involucra el tamaño de semilla de la descendencia en comparación con el tamaño de semilla de los padres. Una relación a través del tamaño medio de semilla en ambas variables tendrá una pendiente menor que1(qué pendiente se puede estimar por lo que llamamos regresión lineal). Cuanto más pequeña es la pendiente, más fuerte es el efecto de "regresión". El tema está ilustrado por Galton en el pdf vinculado por las alturas de los niños (como adultos) en comparación con las alturas promedio de los padres (las mujeres se aumentan por un factor constante de8%para hacerlos comparables a los machos). Los diagramas en las páginas tercera a quinta indican algo de lo que se observó.

Entonces, un intento de estimar el tamaño de esta "regresión a la media" se obtiene por lo que se llamó regresión lineal. Por supuesto, no está sucediendo nada especial: la regresión a la media no es un "impulso a la mediocridad" biológico especial como se podría haber adivinado originalmente, sino una consecuencia bastante simple de las matemáticas de la situación en el mismo sentido que las correlaciones son siempre entre-1 y 1.

Glen_b -Reinstate a Monica
fuente
He reemplazado su uso bruto de \ qquad con el uso adecuado de "alinear" en MathJax, además de algunos otros detalles de MathJax, y espero la revisión por pares de la edición.
Michael Hardy
@Michael Soy consciente de la alineación y la he usado muchas veces, pero ¿cuál es el beneficio real en la edición en este caso? Quería dejarlo alineado en lugar de en el centro para dejar espacio para que los comentarios estuvieran en una sola línea y quería que los comentarios no estuvieran en el texto pesado con el que MahJax te deja, prefiriendo el texto ligero de marcado ordinario. El resultado actual es algo que ya no coincide con la apariencia que realmente estaba buscando. En lugar de ser "crudo", fue elegido deliberadamente. Si tienes una forma de lograr lo que quería con menos esfuerzo que el mío, soy todo oídos.
Glen_b -Reinstalar Monica
ok, supongo que no todos los gustos están de acuerdo...
Michael Hardy
La apariencia diseñada es ideal, creo, para artículos y libros, pero no siempre refleja lo que creo que es mejor en un foro como este, al menos no siempre. Reconozco que mis gustos sobre este tema (y muchos otros aspectos de la apariencia del sitio que a menudo trato de solucionar) pueden ser diferentes de la norma, por lo que lo dejaré como está, pero no prometo intentar continuar. Intento alinearme para hacer lo que quiero cuando parece más fácil hacerlo de otras maneras.
Glen_b -Reinstate Monica
¿El teorema también va en la otra dirección? Es decir, dadoX y Y, siempre podemos concluir que mi(YX)=(β0 0+β1X)+ϵ Para el β0 0,β1los coeficientes de regresión? Si no, ¿cuáles son las condiciones para cuando podemos y no podemos decir esto?
George