No estoy seguro si normalizar es la palabra correcta para usar aquí, pero haré todo lo posible para ilustrar lo que estoy tratando de preguntar. El estimador utilizado aquí es de mínimos cuadrados.
Supongamos que tiene , puede centrarlo alrededor de la media por donde y x_1' = x- \ bar x , entonces que \ beta_0 ' ya no influye en la estimación de \ beta_1 .y = β 0 + β 1 x 1
Con esto quiero decir que β 1
¿Cómo se aplica este método en general? Ahora tengo el modelo y = β 1 e x 1 t + β 2 e x 2 t
Respuestas:
Aunque no puedo hacer justicia a la pregunta aquí, eso requeriría una pequeña monografía, puede ser útil recapitular algunas ideas clave.
La pregunta
Comencemos volviendo a plantear la pregunta y utilizando una terminología inequívoca. Los datos consisten en una lista de pares ordenados . Las constantes conocidas y determinan los valores y . Nosotros proponemos un modelo en el cual( t i , y i )(ti,yi) α 1 α 2 x 1 , i = exp ( α 1 t i ) x 2 , i = exp ( α 2 t i )α1 α2 x1,i=exp(α1ti) x2,i=exp(α2ti)
y i = β 1 x 1 , i + β 2 x 2 , i + ε i
para que las constantes y se estimen, son aleatorias y, de todos modos, para una buena aproximación, independientes y tienen una varianza común (cuya estimación también es de interés).β 1 β 2 ε iβ1 β2 εi
Antecedentes: "coincidencia" lineal
Mosteller y Tukey se refieren a las variables = y como "matchers". Se utilizarán para "hacer coincidir" los valores de de una manera específica, lo que ilustraré. En términos más generales, supongamos que y sean dos vectores en el mismo espacio vectorial euclidiano, con desempeñando el papel de "objetivo" el de "emparejador". Contemplamos variar sistemáticamente un coeficiente para aproximar por el múltiplo .x 1 ( x 1 , 1 , x 1 , 2 , … ) x 2 y = ( y 1 , y 2 , … ) y x y x λ y λx1 (x1,1,x1,2,…) x2 y=(y1,y2,…) y x y x λ y x λ x yλx λx y como sea posible. De manera equivalente, la longitud al cuadrado de se minimiza.y - λ xy−λx
Una forma de visualizar este proceso de correspondencia es hacer un diagrama de dispersión de e sobre el cual se dibuja la gráfica de . Las distancias verticales entre los puntos del diagrama de dispersión y este gráfico son los componentes del vector residual ; la suma de sus cuadrados debe hacerse lo más pequeña posible. Hasta una constante de proporcionalidad, estos cuadrados son las áreas de círculos centrados en los puntos con radios iguales a los residuales: deseamos minimizar la suma de áreas de todos estos círculos.Xx y x → λ xy x→λx y - λ x (y−λx x i , y i )(xi,yi)
Aquí hay un ejemplo que muestra el valor óptimo de en el panel central:λλ
Los puntos en el diagrama de dispersión son azules; la gráfica de es una línea roja. Esta ilustración enfatiza que la línea roja está obligada a pasar a través del origen : es un caso muy especial de ajuste de línea.x → λ x ( 0 , 0 )x→λx (0,0)
Se puede obtener regresión múltiple por coincidencia secuencial
Volviendo a la configuración de la pregunta, tenemos un objetivo y dos indicadores y . Buscamos los números y para los cuales se aproxima lo más posible por , nuevamente en el sentido de la menor distancia. Comenzando arbitrariamente con , Mosteller y Tukey coinciden con las variables restantes x 2 e con . Escriba los residuos para estas coincidencias como e , respectivamente: el indica queyy x1x1 x2x2 b1b1 b2b2 yy b1x1+b2x2b1x1+b2x2 x1x1 x2 yy x1x1 x2⋅1x2⋅1 y⋅1y⋅1 ⋅1⋅1 x1x1 ha sido "sacado de" la variable.
Podemos escribir
y = λ 1 x 1 + y ⋅ 1 y x 2 = λ 2 x 1 + x 2 ⋅ 1 .
Habiendo tomado x 1 de x 2 e y , procedemos a hacer coincidir los residuos objetivo y ⋅ 1 con los residuos de coincidencia x 2 ⋅ 1 . Los residuos finales son y ⋅ 12 . Algebraicamente, hemos escritox1 x2 y y⋅1 x2⋅1 y⋅12
y ⋅ 1 = λ 3 x 2 ⋅ 1 + y ⋅ 12 ; de donde y = λ 1 x 1 + y ⋅ 1 = λ 1 x 1 + λ 3 x 2 ⋅ 1 + y ⋅ 12 = λ 1 x 1 + λ 3 ( x 2 - λ 2 x 1 ) +y ⋅ 12= ( λ 1 - λ 3 λ 2 ) x 1 + λ 3 x 2 + y ⋅ 12 .
Esto muestra que el λ 3 en el último paso es el coeficiente de x 2 en una coincidencia de x 1 y x 2 a y .λ3 x2 x1 x2 y
También podríamos haber procedido primero tomando x 2 de x 1 e y , produciendo x 1 ⋅ 2 e y ⋅ 2 , y luego tomando x 1 ⋅ 2 de y ⋅ 2 , produciendo un conjunto diferente de residuos y ⋅ 21 . Esta vez, el coeficiente de x 1 encontrado en el último paso, llamémoslo μ 3, es el coeficiente de x 1 en una coincidencia de x 1 yx2 x1 y x1⋅2 y⋅2 x1⋅2 y⋅2 y⋅21 x1 μ3 x1 x1 x 2 a y .x2 y
Finalmente, para comparación, podríamos ejecutar un múltiplo (regresión de mínimos cuadrados ordinarios) de y contra x 1 y x 2 . Deje que esos residuos sean y ⋅ l m . Resulta que los coeficientes en esta regresión múltiple son precisamente los coeficientes μ 3 y λ 3 encontrados previamente y que los tres conjuntos de residuos, y ⋅ 12 , y ⋅ 21 e y ⋅ l m , son idénticos.y x1 x2 y⋅lm μ3 λ3 y⋅12 y⋅21 y⋅lm
Representando el proceso
Nada de esto es nuevo: todo está en el texto. Me gustaría ofrecer un análisis pictórico, utilizando una matriz de diagrama de dispersión de todo lo que hemos obtenido hasta ahora.
Debido a que estos datos son simulados, tenemos el lujo de mostrar los valores "verdaderos" subyacentes de y en la última fila y columna: estos son los valores β 1 x 1 + β 2 x 2 sin el error agregado.y β1x1+β2x2
Los diagramas de dispersión debajo de la diagonal se han decorado con los gráficos de los comparadores, exactamente como en la primera figura. Los gráficos con pendientes cero se dibujan en rojo: indican situaciones en las que el comparador no nos da nada nuevo; los residuos son los mismos que el objetivo. Además, como referencia, el origen (donde sea que aparezca dentro de un diagrama) se muestra como un círculo rojo abierto: recuerde que todas las líneas coincidentes posibles deben pasar por este punto.
Se puede aprender mucho sobre la regresión mediante el estudio de esta trama. Algunos de los aspectos más destacados son:
La coincidencia de x 2 a x 1 (fila 2, columna 1) es pobre. Esta es una buena cosa: esto indica que x 1 y x 2 están proporcionando información muy diferente; usar ambos juntos probablemente será mucho más adecuado para y que usar uno solo.x2 x1 x1 x2 y
Una vez que se ha sacado una variable de un objetivo, no sirve de nada tratar de sacar esa variable nuevamente: la mejor línea coincidente será cero. Vea los diagramas de dispersión para x 2 ⋅ 1 versus x 1 o y ⋅ 1 versus x 1 , por ejemplo.x2⋅1 x1 y⋅1 x1
Los valores x 1 , x 2 , x 1 ⋅ 2 y x 2 ⋅ 1 se han tomado de y ⋅ l m .x1 x2 x1⋅2 x2⋅1 y⋅lm
La regresión múltiple de y contra x 1 y x 2 se puede lograr primero calculando y ⋅ 1 y x 2 ⋅ 1 . Estos diagramas de dispersión aparecen en (fila, columna) = ( 8 , 1 ) y ( 2 , 1 ) , respectivamente. Con estos residuos en la mano, observamos su diagrama de dispersión en ( 4 , 3 ) . Estas tres variablesy x1 x2 y⋅1 x2⋅1 (8,1) (2,1) (4,3) las regresiones hacen el truco. Como explican Mosteller y Tukey, los errores estándar de los coeficientes también se pueden obtener casi tan fácilmente de estas regresiones, pero ese no es el tema de esta pregunta, así que me detendré aquí.
Código
Estos datos fueron (reproducibles) creados
R
con una simulación. Los análisis, los controles y las parcelas también se produjeron conR
. Este es el código.fuente
y.21
y.12