De acuerdo, así que solo un poco confuso en algunas cosas, cualquier ayuda sería muy apreciada. Entiendo que el modelo de regresión lineal se predice a través de una expectativa condicional
- ¿Asumimos que tanto como son variables aleatorias con alguna distribución de probabilidad desconocida? Tenía entendido que solo los residuos y los coeficientes beta estimados eran variables aleatorias. si es así, como ejemplo, si obesidad y edad, si tomamos la expectativa condicional , ¿cuál es el valor esperado de ser obeso si el individuo tiene en la muestra? solo tome el promedio (media aritmética) de y para esas observaciones donde ? ¿pero el valor esperado no implica que debemos multiplicar esto por la probabilidad de que ocurra? pero cómo en ese sentido encontramos la probabilidad de laY Y = X = E ( Y | X = 35 ) 35 X = 35 X-valor de valor que ocurre si representa algo así como la edad?
- Si representara algo así como el tipo de cambio, ¿se clasificaría como aleatorio? ¿Cómo demonios encontrarías el valor esperado de esto sin saber la probabilidad? o el valor esperado sería igual a la media en el límite.
- Si no asumimos que las variables dependientes son en sí mismas variables aleatorias, ya que no anulamos la probabilidad, ¿qué suponemos que son? solo valores fijos o algo? pero si este es el caso, ¿cómo podemos condicionar una variable no aleatoria para empezar? ¿Qué asumimos acerca de la distribución de variables independientes?
Lo siento si algo no tiene sentido o es obvio para alguien.
regression
William Carulli
fuente
fuente
Respuestas:
En el modelo de probabilidad que subyace a la regresión lineal, X e Y son variables aleatorias.
Así es. En general, no puede esperar tener suficientes datos en cada valor específico de X, o puede ser imposible hacerlo si X puede tomar un rango continuo de valores. Pero conceptualmente, esto es correcto.
Esta es la diferencia entre la expectativa incondicional y la expectativa condicional . La relación entre ellos esE [ Y ∣ X = x ]mi[ Y] mi[ Y∣ X= x ]
cual es la ley de la expectativa total.
Generalmente no lo hace en regresión lineal. Como estamos tratando de determinar , no necesitamos saber .mi[Y∣X] PAGr [X= x ]
Nos qué asumimos que Y es una variable aleatoria. Una forma de pensar en la regresión lineal es como un modelo de probabilidad paraY
Lo que dice que, una vez que conoce el valor de X, la variación aleatoria en Y se limita a la suma y .norte( 0 , σ)
fuente
Habrá MUCHAS respuestas a esta pregunta, pero aún quiero agregar una, ya que usted hizo algunos puntos interesantes. Por simplicidad, solo considero el modelo lineal simple.
La ecuación fundamental de un simple análisis de regresión lineal es: Este significado ecuación es que el valor medio de es lineal en los valores de . También se puede notar que el valor esperado también es lineal en los parámetros y , razón por la cual el modelo se llama lineal. Esta ecuación fundamental se puede volver a escribir como: donde es una variable aleatoria con media cero:Y X β 0 β 1 Y = β 0 + β 1 X + ϵ , ϵ
La variable independiente puede ser aleatoria o fija. La variable dependiente es SIEMPRE aleatoria.YX Y
Por lo general, se supone que son números fijos. Esto se debe a que el análisis de regresión se desarrolló y se aplica ampliamente en el contexto de experimentos diseñados, donde los valores de se fijaron previamente.X{ X1, . . . , Xnorte} X
Las fórmulas para las estimaciones de mínimos cuadrados de y son las mismas, incluso si se supone que las son aleatorias, pero la distribución de estas estimaciones generalmente no será la misma en comparación con la situación con fijas .β 1 X Xβ0 0 β1 X X
En el modelo lineal simple, puede construir una estimación de basada en las estimaciones de y , a saber: El condicional de mínimos cuadrados tiene una expresión igual a la que usted describió si su modelo trata los diferentes pesos como niveles de un solo factor. Esos modelos también se conocen como ANOVA unidireccional, que es un caso particular de modelo lineal (no simple).E(Y|X=x) β 0 β 1 φ (x)= β 0+ ß 1xφ^(x) E(Y|X=x) β^0 β^1
fuente