¿Por qué R devolvería NA como un coeficiente lm ()?

32

Estoy adaptando un lm()modelo a un conjunto de datos que incluye indicadores para el trimestre financiero (Q1, Q2, Q3, lo que hace que Q4 sea un valor predeterminado). Usando lm(Y~., data = data) obtengo a NAcomo coeficiente para Q3, y una advertencia de que una variable fue excluida debido a singularidades.

¿Necesito agregar una columna Q4?

Fraijo
fuente

Respuestas:

39

NA como coeficiente en una regresión indica que la variable en cuestión está relacionada linealmente con las otras variables. En su caso, esto significa que para algunos . Si este es el caso, entonces no hay una solución única para la regresión sin soltar una de las variables. Agregar solo empeorará las cosas.Q3=una×Q1+si×Q2+douna,si,doQ4 4

Martin O'Leary
fuente
1
Estoy de acuerdo ... parece haber un problema con las definiciones de variables ficticias.
Dominic Comtois
14
pags>norte
2
pags>norte
Las variables no están relacionadas linealmente, como Q3 = 1 iff Q1 = Q2 = 0. Además, usar stepAIC () y forzar al modelo a incluir las tres variables no causa problemas. Además, tengo aproximadamente 3 veces el número de observaciones a las variables. Mi mejor conjetura es que existe una colinealidad entre Q3 y alguna otra variable, que supongo que no está incluida en el stepAIC.
Fraijo