En una serie de paquetes estadísticos que incluyen SAS, SPSS y quizás más, existe una opción para "suprimir la intercepción". ¿Por qué querrías hacer eso?
fuente
En una serie de paquetes estadísticos que incluyen SAS, SPSS y quizás más, existe una opción para "suprimir la intercepción". ¿Por qué querrías hacer eso?
Si por alguna razón usted sabe el intercepto (sobre todo si es cero), se puede evitar la pérdida de la varianza en los datos para la estimación de algo que ya saben, y tienen más confianza en los valores que no tiene que estimar.
Un ejemplo algo simplificado es si ya sabe (por conocimiento del dominio) que una variable es (en promedio) un múltiplo de otra, y está tratando de encontrar ese múltiplo.
Considere el caso de una covariable categórica de 3 niveles. Si uno tiene una intersección, eso requeriría 2 variables indicadoras. Usando la codificación habitual para las variables indicadoras, el coeficiente para cualquiera de las variables indicadoras es la diferencia de medias en comparación con el grupo de referencia. Al suprimir la intersección, tendría 3 variables que representan la covariable categórica, en lugar de solo 2. Un coeficiente es entonces la estimación media para ese grupo. Un ejemplo más concreto de dónde hacer esto es en ciencias políticas, donde uno puede estar estudiando los 50 estados de los Estados Unidos. En lugar de tener una intersección y 49 variables indicadoras para los estados, a menudo es preferible suprimir la intersección y en su lugar tener 50 variables.
Para ilustrar el punto de @Nick Sabbe con un ejemplo específico.
Una vez vi a un investigador presentar un modelo de la edad de un árbol en función de su ancho. Se puede suponer que cuando el árbol está en edad cero, efectivamente tiene un ancho de cero. Por lo tanto, no se requiere una intercepción.