¿Cuáles son los supuestos para aplicar un modelo de regresión de Tobit?

9

Mi conocimiento (muy básico) del modelo de regresión de Tobit no es de una clase, como preferiría. En cambio, he recogido información aquí y allá a través de varias búsquedas en Internet. Mi mejor suposición sobre los supuestos para la regresión truncada es que son muy similares a los supuestos de mínimos cuadrados ordinarios (MCO). Sin embargo, no tengo idea si eso es correcto.

De ahí mi pregunta: ¿Cuáles son los supuestos que debo verificar al realizar la regresión de Tobit?

Nota: La forma original de esta pregunta se refería a la regresión truncada, que no era el modelo que estaba usando o sobre el que preguntaba. He corregido la pregunta.

regression assumptions Pluma de fuego
fuente

1

No debe utilizar la regresión truncada solo porque tiene datos sesgados o delimitados. Es específicamente para situaciones en las que los valores por debajo de un umbral (por ejemplo, valores negativos) son posibles, pero no se observarán por alguna razón. ¿Es esa la situación que tienes?

Aniko

@Aniko, los valores negativos de la variable dependiente realmente no tienen sentido (significaría recibir un pago por recibir un servicio), pero escuché que Wooldridge (en Análisis econométrico de datos de sección transversal y panel , 2002) había recomendado truncar o modelos de regresión censurados en lugar de OLS cuando aún es una variable aleatoria continua sobre valores positivos.

P (Y = 0) > 0

$P(Y=0)>0$

Y

$Y$

Pluma de fuego

Un gran error; Me di cuenta de que me refería a la regresión de Tobit todo el tiempo, no a la regresión truncada . Acabo de cambiar la pregunta para reflejar este error.

Firefeather

La referencia de Wooldridge sigue siendo la referencia correcta; es decir, se refiere a la regresión de Tobit.

Firefeather

Aniko tiene razón, ese tobit podría no ser la mejor opción. Eche un vistazo a lo siguiente para conocer alternativas: ideas.repec.org/p/boc/bost10/2.html

6

Si buscamos una respuesta simple, el extracto del libro de Wooldridge (página 533) es muy apropiado:

... tanto la heterocedasticidad como la no normalidad hacen que el estimador Tobit sea inconsistente para . Esta inconsistencia ocurre porque la densidad derivada de dado depende crucialmente de . Esta no robustez del estimador Tobit muestra que la censura de datos puede ser muy costosa: en ausencia de censura ( ) podría estimarse consistentemente bajo [o incluso ]. $\hat{\beta}$ $\beta$ $y$ $x$ $y^*|x\sim\mathrm{Normal}(x\beta,\sigma^2)$ $y=y^*$ $\beta$ $E(u|x)=0$ $E(x'u)=0$

Las anotaciones en este extracto provienen del modelo Tobit:

\begin{aligned} y^{*} & = x β + u, u | x \sim N (0, σ^{2}) \\ y^{*} & = max (y^{*}, 0) \end{aligned}

$\begin{align} y^{*}&=x\beta+u, \quad u|x\sim N(0,\sigma^2)\\ y^{*}&=\max(y^*,0) \end{align}$ donde se observan y .

y

$y$

x

$x$

Resumir la diferencia entre mínimos cuadrados y la regresión de Tobit es el supuesto inherente de normalidad en este último.

También siempre pensé que el artículo original de Amemyia era bastante agradable al exponer los fundamentos teóricos de la regresión de Tobit.

mpiktas
fuente

¡Guauu! Gracias por encontrar una referencia visible: no había pensado en buscar en Google Books cuando buscaba una copia del libro de Wooldridge.

Firefeather

4

Para hacer eco del comentario de Aniko: La suposición principal es la existencia de truncamiento. Este no es el mismo supuesto que las otras dos posibilidades que su publicación me sugiere: limitación y selección de muestra.

Si tiene una variable dependiente fundamentalmente limitada en lugar de una truncada, es posible que desee pasar a un marco de modelo lineal generalizado con una de las distribuciones (menos elegidas) para Y, por ejemplo, log-normal, gamma, exponencial, etc., que respeten límite inferior.

Alternativamente, puede preguntarse si cree que el proceso que genera las observaciones cero en su modelo es el mismo que genera los valores estrictamente positivos: los precios en su aplicación, creo. Si este no es el caso, entonces algo de la clase de modelos de selección de muestra (por ejemplo, modelos de Heckman) podría ser apropiado. En ese caso, estaría en la situación de especificar un modelo de estar dispuesto a pagar cualquier precio, y otro modelo de qué precio pagarían sus sujetos si quisieran pagar algo.

En resumen, probablemente desee revisar la diferencia entre suponer variables dependientes seleccionadas truncadas, censuradas, limitadas y seleccionadas. El que desee vendrá de los detalles de su aplicación. Una vez que se hace la primera suposición más importante, puede determinar más fácilmente si le gustan las suposiciones específicas de cualquier modelo en la clase elegida. Algunos de los modelos de selección de muestra tienen supuestos que son bastante difíciles de verificar ...

conjugadoprior
fuente

3

@Firefeather: ¿Sus datos contienen (y realmente solo pueden contener) solo valores positivos? Si es así, modele usando un modelo lineal generalizado con error gamma y enlace de registro. Si contiene ceros, entonces podría considerar una etapa doble (regresión logística para probabilidad de cero y regresión gamma para los valores positivos). Este último escenario también se puede modelar como una regresión única utilizando una gamma inflada a cero. Algunas buenas explicaciones de esto se dieron en una lista SAS hace unos años. Comience aquí si está interesado y busque seguimientos. Texto del enlace

Podría ayudarlo a apuntar en otra dirección si la regresión truncada resulta inverosímil.

B_Miner
fuente

2

Como otros han mencionado aquí, la aplicación principal de la regresión tobit es donde hay censura de datos. Tobit es ampliamente utilizado en conjunto con el Análisis de Envoltura de Datos (DEA) y por el economista. En DEA, la puntuación de eficiencia se encuentra entre 0 y 1, lo que significa que la variable dependiente está censurada en 0 desde la izquierda y 1 desde la derecha. Por lo tanto, la aplicación de regresión lineal (MCO) no es factible.

Tobit es una combinación de probit y regresión truncada. Se debe tener cuidado al diferenciar la censura y el truncamiento:

Censura: cuando las observaciones límite están en la muestra. Los valores de las variables dependientes alcanzan un límite hacia la izquierda o hacia la derecha.
Truncamiento: observación en la que cierto rango de valores dependientes no se incluye en el estudio. Por ejemplo, solo valores positivos. El truncamiento tiene una mayor pérdida de información que la censura.

Tobit = Probit + Regresión de truncamiento

El modelo Tobit asume la normalidad como lo hace el modelo probit.

Pasos:

El modelo Probit decide si la variable dependiente es 0 o 1. Si la variable dependiente es 1, entonces por cuánto (suponiendo censurar en 0) .
$\begin{matrix} (Discreet decision) & P (y > 0) = Φ (x^{^{'}} β) \end{matrix}$ $P(y>0) = Φ(x^{'} β) \tag{Discreet decision}$
$E(y│y>0)= x^{'} β+ σλ\big(\frac{x^{'} β}{σ}\big) \tag{Continuous decision}$

El coeficiente es el mismo para el modelo de decisión. es el término de corrección para ajustar los valores censurados (ceros). $β$ $σλ\big(\frac{x^{'} β}{σ}\big)$

Compruebe también el modelo de Cragg donde puede usar diferentes en cada paso. $β$

Amar nayak
fuente

Bienvenido al sitio, @Amarnayak. He editado su publicación para usar el formato de tipo . Asegúrate de que todavía diga lo que quieres.

L A T E X

$\LaTeX$

gung - Restablecer Monica

¿Cuáles son los supuestos para aplicar un modelo de regresión de Tobit?

Respuestas: