Estoy dando una presentación sobre líneas de ajuste. Tengo una función lineal simple, . Estoy tratando de obtener puntos de datos dispersos que puedo poner en un diagrama de dispersión que mantendrá mi línea de mejor ajuste en la misma ecuación.
Me encantaría aprender esta técnica en R o Excel, lo que sea más fácil.
r
regression
least-squares
excel
Ryan Chase
fuente
fuente
Respuestas:
Elija cualquiera(xi) siempre que al menos dos de ellos difieran. Establezca una intersección β0 y una pendiente β1 y defina
Este ajuste es perfecto. Sin cambiar el ajuste, puede modificary0 a y=y0+ε agregando cualquier vector de error ε=(εi) siempre que sea ortogonal tanto al vector x=(xi) como al vector constante (1,1,…,1) . Una manera fácil de obtener este tipo de error es escoger cualquier vector de e y dejar que ε sea los residuos sobre la regresión de e contra x . En el siguiente código, e se genera como un conjunto de valores normales aleatorios independientes con media 0 y desviación estándar común.
Además, incluso puede preseleccionar la cantidad de dispersión, tal vez estipulando lo que debe serR2 . Dejando τ2=var(yi)=β21var(xi) , reescalar esos residuos para tener una varianza de
Este método es completamente general: todos los ejemplos posibles (para un conjunto dado dexi ) se pueden crear de esta manera.
Ejemplos
Cuarteto de Anscombe
Podemos reproducir fácilmente el Cuarteto de Anscombe de cuatro conjuntos de datos bivariados cualitativamente distintos que tienen las mismas estadísticas descriptivas (a través del segundo orden).
El código es notablemente simple y flexible.
La salida proporciona las estadísticas descriptivas de segundo orden para los datos(x,y) de cada conjunto de datos. Las cuatro líneas son idénticas. Puede crear fácilmente más ejemplos alterando
x
(las coordenadas x) ye
(los patrones de error) desde el principio.Simulaciones
R
(No sería difícil portar esto a Excel, pero es un poco doloroso).
Al ejecutarR2 es el valor pretendido Otras estadísticas, como el valor p de regresión, se pueden ajustar modificando los valores deXyo .
summary(fit)
, puede verificar que los coeficientes estimados son exactamente como se especifica y los múltiplesfuente