En una serie de paquetes estadísticos que incluyen SAS, SPSS y quizás más, existe una opción para "suprimir la intercepción". ¿Por qué querrías hacer eso?
regression
usuario333
fuente
fuente
Considere el caso de una covariable categórica de 3 niveles. Si uno tiene una intersección, eso requeriría 2 variables indicadoras. Usando la codificación habitual para las variables indicadoras, el coeficiente para cualquiera de las variables indicadoras es la diferencia de medias en comparación con el grupo de referencia. Al suprimir la intersección, tendría 3 variables que representan la covariable categórica, en lugar de solo 2. Un coeficiente es entonces la estimación media para ese grupo. Un ejemplo más concreto de dónde hacer esto es en ciencias políticas, donde uno puede estar estudiando los 50 estados de los Estados Unidos. En lugar de tener una intersección y 49 variables indicadoras para los estados, a menudo es preferible suprimir la intersección y en su lugar tener 50 variables.
fuente
Para ilustrar el punto de @Nick Sabbe con un ejemplo específico.
Una vez vi a un investigador presentar un modelo de la edad de un árbol en función de su ancho. Se puede suponer que cuando el árbol está en edad cero, efectivamente tiene un ancho de cero. Por lo tanto, no se requiere una intercepción.
fuente