Suponga que su conjunto de datos consta de un conjunto para i = 1 , ... , ny desea ver la dependencia de y de x .( xyo, yyo)i = 1 , ... , nyX
Supongamos que encontrar los valores de α y β de α y β que minimizar la suma de cuadrados residual
n Σ i = 1 ( y i - ( α + β x i ) ) 2 .
Luego se toma y = α + β x para ser el predicho y -valor para cualquier (no necesariamente ya se ha observado) x -valor. Eso es regresión lineal.α^β^αβ
∑i = 1norte( yyo- ( α + βXyo) )2.
y^= α^+ β^XyX
Ahora considere descomponer la suma total de cuadrados
conn-1grados de libertad, en partes "inexplicables" "explicado" y:
n Σ i = 1 ( ( α + β x i ) - ˉ y ) 2 ⏟ explicó+ n Σ i = 1 ( y i - (
∑i = 1norte( yyo- y¯)2donde y¯= y1+ ⋯ + ynortenorte
n - 1
con
1∑i = 1norte( ( α^+ β^Xyo) - y¯)2explicado + ∑ i = 1norte( yyo- ( α^+ β^Xyo) )2inexplicable.
1y
grados de libertad, respectivamente. Eso es el análisis de la varianza, y uno a continuación considera cosas como estadísticas F
F = Σ n i = 1 ( ( α + β x i ) - ˉ y ) 2 / 1n - 2Estaestadística F prueba la hipótesis nula
β=0.
F= ∑nortei = 1( ( α^+ β^Xyo) - y¯)2/ 1∑nortei = 1( yyo- ( α^+ β^Xyo) )2/ (n-2).
β= 0
y= α + βyo
yokk - 1n−k
Un par de puntos adicionales:
- Para algunos matemáticos, el relato anterior puede hacer parecer que todo el campo es solo lo que se ve arriba, por lo que puede parecer misterioso que tanto la regresión como el análisis de varianza sean áreas de investigación activas. Hay muchas cosas que no encajan en una respuesta apropiada para publicar aquí.
- y=α+βx
La principal diferencia es la variable de respuesta. Mientras que la regresión logística se ocupa de una respuesta binaria en el análisis de regresión lineal y también de la regresión no lineal, la variable de respuesta es continua. Tiene una variable (s) (también conocida como covariable (s)) que tiene una relación funcional con la variable de respuesta continua. En el análisis de varianza, la respuesta es continua pero pertenece a unas pocas categorías diferentes (por ejemplo, grupo de tratamiento y grupo de control). En el análisis de varianza, busca la diferencia en la respuesta media entre grupos. En la regresión lineal, observa cómo cambia la respuesta a medida que cambian las covariables. Otra forma de ver la diferencia es decir que en la regresión las covariables son continuas, mientras que en el análisis de varianza son un conjunto discreto de grupos.
fuente
El análisis de varianza (ANOVA) es un cuerpo de método estadístico para analizar observaciones que se supone son de la estructura.
Si el {Xyo j } son valores tomados en las observaciones, no por variables de contador sino por variables continuas como t = tiempo,T = temperatura,t2, e- T , etc., entonces tenemos un caso de análisis de regresión *. En general, en el análisis de regresión todos los factores son cuantitativos y se tratan cuantitativamente.
Principalmente, estos dos son dos tipos de análisis.
fuente
En el análisis de regresión, tiene una variable fija y desea saber cómo va la variable con la otra variable.
En el análisis de varianza, usted quiere saber, por ejemplo: si este alimento específico para animales influye en el peso de los animales ... SO uno fijó la var y la influencia en los demás.
fuente