Con datos continuos, una regresión lineal supone que el término de error se distribuye N (0, )
1) ¿Asumimos que Var (Y | x) es igualmente ~ N (0, )?
2) ¿Cuál es esta distribución de errores en regresión logística? Cuando los datos están en forma de 1 registro por caso, donde la "Y" es 1 o 0, es el término de error distribuido Bernoulli (es decir, la varianza es p (1-p))) y cuando los datos están en la forma # éxitos de # de ensayos, ¿se supone binomial (es decir, la varianza es np (1-p)), donde p es la probabilidad de que Y sea 1?
logistic
generalized-linear-model
B_Miner
fuente
fuente
Respuestas:
1) Si tiene una distribución normal, es decir, entonces , ya que No es una variable aleatoria.u V a r ( Y | X 2 ) = V a r ( β 1 + β 2 X 2 ) + V a r ( u ) = 0 + σ 2 = σ 2 β 1 + β 2 X 2N(0,σ2) Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2 β1+β2X2
2) En la regresión logística, se supone que los errores siguen una distribución binomial como se menciona aquí . Es mejor escribirlo como , ya que esas probabilidades dependen de , como se hace referencia aquí o en Regresión logística aplicada .X jVar(Yj|Xj)=mj.E[Yj|Xj].(1−E[Yj|Xj])=mjπ(Xj).(1−π(Xj)) Xj
fuente