Mi conocimiento (muy básico) del modelo de regresión de Tobit no es de una clase, como preferiría. En cambio, he recogido información aquí y allá a través de varias búsquedas en Internet. Mi mejor suposición sobre los supuestos para la regresión truncada es que son muy similares a los supuestos de mínimos cuadrados ordinarios (MCO). Sin embargo, no tengo idea si eso es correcto.
De ahí mi pregunta: ¿Cuáles son los supuestos que debo verificar al realizar la regresión de Tobit?
Nota: La forma original de esta pregunta se refería a la regresión truncada, que no era el modelo que estaba usando o sobre el que preguntaba. He corregido la pregunta.
regression
assumptions
Pluma de fuego
fuente
fuente
Respuestas:
Si buscamos una respuesta simple, el extracto del libro de Wooldridge (página 533) es muy apropiado:
... tanto la heterocedasticidad como la no normalidad hacen que el estimador Tobit sea inconsistente para . Esta inconsistencia ocurre porque la densidad derivada de dado depende crucialmente de . Esta no robustez del estimador Tobit muestra que la censura de datos puede ser muy costosa: en ausencia de censura ( ) podría estimarse consistentemente bajo [o incluso ].β^ β y x y∗|x∼Normal(xβ,σ2) y=y∗ β E(u|x)=0 E(x′u)=0
Las anotaciones en este extracto provienen del modelo Tobit:
Resumir la diferencia entre mínimos cuadrados y la regresión de Tobit es el supuesto inherente de normalidad en este último.
También siempre pensé que el artículo original de Amemyia era bastante agradable al exponer los fundamentos teóricos de la regresión de Tobit.
fuente
Para hacer eco del comentario de Aniko: La suposición principal es la existencia de truncamiento. Este no es el mismo supuesto que las otras dos posibilidades que su publicación me sugiere: limitación y selección de muestra.
Si tiene una variable dependiente fundamentalmente limitada en lugar de una truncada, es posible que desee pasar a un marco de modelo lineal generalizado con una de las distribuciones (menos elegidas) para Y, por ejemplo, log-normal, gamma, exponencial, etc., que respeten límite inferior.
Alternativamente, puede preguntarse si cree que el proceso que genera las observaciones cero en su modelo es el mismo que genera los valores estrictamente positivos: los precios en su aplicación, creo. Si este no es el caso, entonces algo de la clase de modelos de selección de muestra (por ejemplo, modelos de Heckman) podría ser apropiado. En ese caso, estaría en la situación de especificar un modelo de estar dispuesto a pagar cualquier precio, y otro modelo de qué precio pagarían sus sujetos si quisieran pagar algo.
En resumen, probablemente desee revisar la diferencia entre suponer variables dependientes seleccionadas truncadas, censuradas, limitadas y seleccionadas. El que desee vendrá de los detalles de su aplicación. Una vez que se hace la primera suposición más importante, puede determinar más fácilmente si le gustan las suposiciones específicas de cualquier modelo en la clase elegida. Algunos de los modelos de selección de muestra tienen supuestos que son bastante difíciles de verificar ...
fuente
@Firefeather: ¿Sus datos contienen (y realmente solo pueden contener) solo valores positivos? Si es así, modele usando un modelo lineal generalizado con error gamma y enlace de registro. Si contiene ceros, entonces podría considerar una etapa doble (regresión logística para probabilidad de cero y regresión gamma para los valores positivos). Este último escenario también se puede modelar como una regresión única utilizando una gamma inflada a cero. Algunas buenas explicaciones de esto se dieron en una lista SAS hace unos años. Comience aquí si está interesado y busque seguimientos. Texto del enlace
Podría ayudarlo a apuntar en otra dirección si la regresión truncada resulta inverosímil.
fuente
Como otros han mencionado aquí, la aplicación principal de la regresión tobit es donde hay censura de datos. Tobit es ampliamente utilizado en conjunto con el Análisis de Envoltura de Datos (DEA) y por el economista. En DEA, la puntuación de eficiencia se encuentra entre 0 y 1, lo que significa que la variable dependiente está censurada en 0 desde la izquierda y 1 desde la derecha. Por lo tanto, la aplicación de regresión lineal (MCO) no es factible.
Tobit es una combinación de probit y regresión truncada. Se debe tener cuidado al diferenciar la censura y el truncamiento:
Tobit = Probit + Regresión de truncamiento
El modelo Tobit asume la normalidad como lo hace el modelo probit.
Pasos:
El modelo Probit decide si la variable dependiente es 0 o 1. Si la variable dependiente es 1, entonces por cuánto (suponiendo censurar en 0) .
El coeficiente es el mismo para el modelo de decisión. es el término de corrección para ajustar los valores censurados (ceros).β σλ(x′βσ)
Compruebe también el modelo de Cragg donde puede usar diferentes en cada paso.β
fuente