¿Cuál es un ejemplo de colinealidad perfecta en términos de la matriz de diseño ?
Quisiera un ejemplo donde β = ( X ' X ) - 1 X ' Y no puede estimarse porque ( X ' X ) no es invertible.
regression
multicollinearity
matrix
matrix-inverse
TsTeaTime
fuente
fuente
Respuestas:
Aquí hay un ejemplo con 3 variables,y , x1 y x2 , relacionados por la ecuación
dondeε∼N(0,1)
Los datos particulares son
Por lo tanto, es evidente quex2 es un múltiplo de x1 por lo tanto, tenemos una colinealidad perfecta.
Podemos escribir el modelo como
dónde:
Entonces tenemos
Ahora calculamos el determinante deXX′ :
En R podemos mostrar esto de la siguiente manera:
crear
x2
, un múltiplo dex1
crear y, una combinación lineal de
x1
,x2
y algo de aleatoriedadobserva eso
no puede estimar un valor para el
x2
coeficiente:La matriz modeloX es:
EntoncesXX′ es
que no es invertible, como lo muestra
O:
fuente
Aquí hay un par de escenarios bastante comunes que producen una multicolinealidad perfecta, es decir, situaciones en las que las columnas de la matriz de diseño dependen linealmente. Recuerde del álgebra lineal que esto significa que hay una combinación lineal de columnas de la matriz de diseño (cuyos coeficientes no son todos cero) que es igual a cero. He incluido algunos ejemplos prácticos para ayudar a explicar por qué este escollo golpea tan a menudo. ¡Me he encontrado con casi todos ellos!
Una variable es un múltiplo de otra , independientemente de si hay un término de intercepción: tal vez porque ha registrado la misma variable dos veces utilizando diferentes unidades (por ejemplo, "longitud en centímetros" es exactamente 100 veces mayor que "longitud en metros") o porque ha registrado una variable una vez como número bruto y una vez como proporción o porcentaje, cuando el denominador es fijo (por ejemplo, "área de placa de Petri colonizada" y "porcentaje de placa de Petri colonizada" serán múltiplos exactos entre sí si el área de cada placa de Petri es lo mismo). Tenemos colinealidad porque si donde w y x son variables (columnas de su matriz de diseño) y awyo= a xyo w X un es una constante escalar, entonces es una combinación lineal de variables que es igual a cero.1 ( w⃗ ) - a ( x⃗ )
Hay un término de intercepción y una variable difiere de otra en una constante : esto sucederá si centra una variable ( ) e incluye tanto x sin procesar como w centrado en su regresión. También ocurrirá si sus variables se miden en diferentes sistemas unitarios que difieren en una constante, por ejemplo, si w es "temperatura en kelvin" yx como "temperatura en ° C", entonces w i = x i + 273.15 . Si consideramos el término de intercepción como una variable que siempre es 1 (representada como una columna de unos,wyo= xyo- x¯ X w w X wyo= xyo+ 273,15 1 , en la matriz de diseño), entonces tenerwi=xi+kpara alguna constanteksignifica que1( → w )-1( → x )-k( → 1 n)es una combinación lineal dew,xy1columnas de la matriz de diseño que es igual a cero.1⃗ norte wyo= xyo+ k k 1 ( w⃗ ) - 1 ( x⃗ ) - k ( 1⃗ norte) w X 1
Hay un término de intercepción y una variable viene dada por una transformación afín de otra : es decir, tiene variables y x , relacionadas por w i = a x i + b donde a y b son constantes. Por ejemplo, esto sucede si estandariza una variable como z i = x i - ˉ xw X wyo= a xyo+ b un si e incluyevariablesx sinprocesaryzestandarizadasen tu regresión. También ocurre si registrawcomo "temperatura en ° F"yxcomo "temperatura en ° C", ya que esos sistemas unitarios no comparten un cero común pero están relacionados porwi=1.8xi+32. O en un contexto comercial, suponga que hay un costo fijob(por ejemplo, la entrega de cobertura) para cada pedido, así como un costo$apor unidad vendida; entonces si$wies el costo del pedidoiyxizyo= xyo- x¯sX X z w X wyo= 1.8 xyo+ 32 si $ a $ wyo yo Xyo es el número de unidades ordenadas, tenemos . La combinación lineal de interés es 1 ( → w ) - a ( → x ) - b ( → 1 n ) = → 0 . Tenga en cuenta que si a = 1 , (3) incluye (2) como un caso especial; si b = 0 , entonces (3) incluye (1) como un caso especial.wyo= a xyo+ b 1 ( w⃗ ) - a ( x⃗ ) - b ( 1⃗ norte) = 0⃗ a = 1 b = 0
Hay un término de intercepción y la suma de varias variables es fija (por ejemplo, en la famosa "trampa de variables ficticias") : por ejemplo, si tiene "porcentaje de clientes satisfechos", "porcentaje de clientes insatisfechos" y "porcentaje de clientes que no están satisfechos ni insatisfecho ", entonces estas tres variables siempre sumarán (salvo error de redondeo) a 100. Una de estas variables, o alternativamente, el término de intercepción, debe eliminarse de la regresión para evitar la colinealidad. La "trampa de variable ficticia" se produce cuando utiliza variables indicadoras (más comúnmente pero menos útiles, llamadas "variables ficticias") para cada nivel posible de una variable categórica. Por ejemplo, supongamos que los floreros se producen en esquemas de color rojo, verde o azul. Si registró la variable categórica "
red
green
yblue
serían variables binarias, almacenadas como1
"sí" y0
"no"), entonces, para cada florero, solo una de las variables sería una, y por lo tantored + green + blue = 1
. Como hay un vector de unos para el término de intercepción, la combinación lineal1(red) + 1(green) + 1(blue) - 1(1) = 0
. El remedio habitual aquí es eliminar la intercepción o eliminar uno de los indicadores (por ejemplo, omitirred
) que se convierte en una línea de base o un nivel de referencia. En este caso, el coeficiente de regresión paragreen
indicaría el cambio en la respuesta media asociada con el cambio de un jarrón rojo a uno verde, manteniendo constantes otras variables explicativas.Hay al menos dos subconjuntos de variables, cada una con una suma fija , independientemente de si hay un término de intercepción: supongamos que los floreros en (4) se produjeron en tres tamaños, y la variable categórica para el tamaño se almacenó como tres variables indicadoras adicionales . Nos hubiera gustadou , v , w , x tuyo+ vyo= k1 luego k 2 ( → u ) + k 2 ( → v ) - k 1 ( → w ) - k 1 ( → x ) = → 0 .Xyo+ yyo= k2 k2( u⃗ ) + k2( v⃗ ) - k1( w⃗ ) - k1( x⃗ ) = 0⃗
large + medium + small = 1
. Luego tenemos la combinación lineal1(large) + 1(medium) + 1(small) - 1(red) - 1(green) - 1(blue) = 0
, incluso cuando no hay término de intercepción. Los dos subconjuntos no necesitan compartir la misma suma, por ejemplo, si tenemos variables explicativas modo que cada u i + v i = k 1 y x i + y i = kUna variable se define como una combinación lineal de varias otras variables : por ejemplo, si registra la longitud , el ancho wy el perímetro p de cada rectángulo, entonces p i = 2 l i + 2 w i entonces tenemos la combinación lineal 1 ( → p ) - 2 ( → l ) - 2 ( → w ) = → 0l w pag pagyo= 2 lyo+ 2 wyo 1 ( p⃗ ) - 2 ( l⃗ ) - 2 ( w⃗ ) = 0⃗ . Un ejemplo de un término de intersección: supongamos que una empresa de pedidos por correo tiene dos líneas de productos, y grabar ese orden consistía en U i del primer producto en el costo unitario $ una y v i del segundo al costo unitario $ b , con cargo de entrega fijo $ c . Si también incluimos el costo del pedido $ x como una variable explicativa, entonces x i = a u i + b v i + c y entonces 1 ( → x ) -yo tuyo $ a vyo $ b $ c $ x Xyo= a uyo+ b vyo+ c . Esta es una generalización obvia de (3). También nos da una forma diferente de pensar sobre (4): una vez que conocemos todos menos uno de los subconjuntos de variables cuya suma es fija, entonces el restante es su complemento, por lo que puede expresarse como una combinación lineal de ellos y su suma . Si sabemos que el 50% de los clientes estaban satisfechos y el 20% estaban insatisfechos, entonces 100% - 50% - 20% = 30% no deben estar satisfechos ni insatisfechos; Si sabemos que el florero no es rojo () y es verde (), entonces sabemos que no es azul ().1 ( x⃗ ) - a ( u⃗ ) - b ( v⃗ ) - c ( 1⃗ norte) = 0⃗
red=0
green=1
blue = 1(1) - 1(red) - 1(green) = 1 - 0 - 1 = 0
Una variable es constante y cero , independientemente de si hay un término de intercepción: en un estudio observacional, una variable será constante si su muestra no exhibe suficiente variación (¡ninguna!). Puede haber una variación en la población que no se captura en su muestra, por ejemplo, si hay un valor modal muy común: quizás el tamaño de su muestra es demasiado pequeño y, por lo tanto, es poco probable que incluya valores que difieran del modo, o sus mediciones fueron insuficientemente preciso para detectar pequeñas variaciones del modo. Alternativamente, puede haber razones teóricas para la falta de variación, particularmente si está estudiando una subpoblación. En un estudio de propiedades de nueva construcción en Los Ángeles, no sería sorprendente que cada punto de datos tengaX 1 ( x⃗ ) 0 0⃗
AgeOfProperty = 0
yState = California
! En un estudio experimental, es posible que haya medido una variable independiente que está bajo control experimental. Si una de sus variables explicativas es constante y cero, entonces tenemos inmediatamente que la combinación lineal 1 ( → x ) (con coeficiente cero para cualquier otra variable) es → 0 .Ejemplos de datos con código R
(1) Una columna es múltiplo de otra
(2) Interceptar término y una variable difiere de otra por constante
(3) Interceptar término y una variable es una transformación afín de otra
(4) El término de intercepción y la suma de varias variables es fijo
(4a) Término de intercepción con trampa variable ficticia
(5) Dos subconjuntos de variables con suma fija
(6) Una variable es una combinación lineal de otras
(7) Una variable es constante y cero
(8) Término de intercepción y una variable constante
(9) Dos variables constantes
fuente
Algunos ejemplos triviales para ayudar a la intuición:
Hay una multitud de formas tales que una columna de datos será una función lineal de sus otros datos. Algunos de ellos son obvios (por ejemplo, metros vs. centímetros) mientras que otros pueden ser más sutiles (por ejemplo, edad y años de escolaridad para niños más pequeños).
fuente