¿Cómo interpreto un modelo probit en Stata?

13

No estoy seguro de cómo interpretar esta regresión probit que ejecuté en Stata. Los datos están en la aprobación del préstamo y el blanco es una variable ficticia que = 1 si una persona era blanca y = 0 si la persona no lo era. Cualquier ayuda sobre cómo leer esto sería muy apreciada. Lo que más busco es cómo encontrar la probabilidad estimada de aprobación de préstamo tanto para blancos como para no blancos. ¿Alguien también puede ayudarme con el texto aquí y cómo hacerlo normal? Lo siento, no sé cómo hacer esto.

. probit approve white

Iteration 0:   log likelihood = -740.34659  
Iteration 1:   log likelihood = -701.33221  
Iteration 2:   log likelihood = -700.87747  
Iteration 3:   log likelihood = -700.87744  

Probit regression                                 
Number of obs   =       1989

LR chi2(1)      =      78.94

Prob > chi2     =     0.0000

Log likelihood = -700.87744                       

Pseudo R2       =     0.0533

para la variable blanco:

Coef.: .7839465  
Std. Err.: .0867118  
z: 9.04  
P>|z|: 0.000  
95% Conf. Interval: .6139946-.9538985  

para la constante:

Coef.: .5469463  
Std. Err.: .075435  
z: 7.25  
P>|z|: 0.000  
95% Conf. Interval: .3990964-.6947962  
Kyle
fuente

Respuestas:

44

En general, no puede interpretar los coeficientes de la salida de una regresión probit (al menos de ninguna manera estándar). Debe interpretar los efectos marginales de los regresores, es decir, cuánto cambia la probabilidad (condicional) de la variable de resultado cuando cambia el valor de un regresor, manteniendo todos los demás regresores constantes en algunos valores. Esto es diferente del caso de regresión lineal donde está interpretando directamente los coeficientes estimados. Esto es así porque en el caso de regresión lineal, los coeficientes de regresión son los efectos marginales .

En la regresión probit, se requiere un paso adicional de cálculo para obtener los efectos marginales una vez que haya calculado el ajuste de la regresión probit.

Modelos de regresión lineal y probit

  • Regresión probit : recuerde que en el modelo probit, está modelando la probabilidad (condicional) de un resultado "exitoso", es decir, , P [ Y i = 1 X 1 i , ... , X K i ; β 0 , , β K ] = Φ ( β 0 + K k = 1 β k X k i ) donde ΦYyo=1

    PAG[Yyo=1X1yo,...,XKyo;β0 0,...,βK]=Φ(β0 0+k=1KβkXkyo)
    es la función de distribución acumulativa de la distribución normal estándar. Básicamente, esto dice que, condicional a los regresores, la probabilidad de que la variable de resultado, Y i sea ​​1, sea una determinada función de una combinación lineal de los regresores.Φ()Yyo
  • Regresión lineal : compárela con el modelo de regresión lineal, donde

la media (condicional) del resultado es una combinación lineal de Los regresores.

mi(YyoX1yo,...,XKyo;β0 0,...,βK)=β0 0+k=1KβkXkyo

Efectos marginales

Aparte del modelo de regresión lineal, los coeficientes rara vez tienen una interpretación directa. Normalmente estamos interesados ​​en los efectos ceteris paribus de los cambios en los regresores que afectan las características de la variable de resultado. Esta es la noción de que los efectos marginales miden.

  • Regresión lineal : ahora me gustaría saber cuánto se mueve la media de la variable de resultado cuando muevo uno de los regresores

mi(YyoX1yo,...,XKyo;β0 0,...,βK)Xkyo=βk

Pero esto es solo el coeficiente de regresión, lo que significa que el efecto marginal de un cambio en el k

  • Regresión probit : sin embargo, es fácil ver que este no es el caso para la regresión probit

PAG[Yyo=1X1yo,...,XKyo;β0 0,...,βK]Xkyo=βkϕ(β0 0+k=1KβkXkyo)
ϕ() es la función de densidad de probabilidad normal estándar.

¿Cómo va a calcular esta cantidad y cuáles son las opciones de los otros regresores que deberían ingresar esta fórmula? Afortunadamente, Stata proporciona este cálculo después de una regresión probit, y proporciona algunos valores predeterminados de las opciones de los otros regresores (no existe un acuerdo universal sobre estos valores predeterminados).

Regresores discretos

Xkyo{0 0,1}

ΔXkyoPAG[Yyo=1X1yo,...,XKyo;β0 0,...,βK]=βkϕ(β0 0+l=1k-1βlXlyo+βk+l=k+1KβlXlyo)-βkϕ(β0 0+l=1k-1βlXlyo+l=k+1KβlXlyo)

Calcular efectos marginales en Stata

Regresión probit : aquí hay un ejemplo de cálculo de efectos marginales después de una regresión probit en Stata.

webuse union   
probit union age grade not_smsa south##c.year
margins, dydx(*)

Aquí está la salida que obtendrá del marginscomando

. margins, dydx(*)

Average marginal effects                          Number of obs   =      26200
Model VCE    : OIM

Expression   : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |    .003442    .000844     4.08   0.000     .0017878    .0050963
       grade |   .0077673   .0010639     7.30   0.000     .0056822    .0098525
    not_smsa |  -.0375788   .0058753    -6.40   0.000    -.0490941   -.0260634
     1.south |  -.1054928   .0050851   -20.75   0.000    -.1154594   -.0955261
        year |  -.0017906   .0009195    -1.95   0.051    -.0035928    .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

Esto se puede interpretar, por ejemplo, que el cambio de una unidad en la agevariable aumenta la probabilidad del estado de la unión en 0.003442. Del mismo modo, al ser del sur, disminuye la probabilidad de estatus sindical en 0.1054928

Regresión lineal : como verificación final, podemos confirmar que los efectos marginales en el modelo de regresión lineal son los mismos que los coeficientes de regresión (con un pequeño giro). Ejecutando la siguiente regresión y calculando los efectos marginales después

sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)

solo te devuelve los coeficientes de regresión. Tenga en cuenta el hecho interesante de que Stata calcula el efecto marginal neto de un regresor, incluido el efecto a través de los términos cuadráticos si se incluye en el modelo.

. margins, dydx(*)

Average marginal effects                          Number of obs   =         74
Model VCE    : OLS

Expression   : Linear prediction, predict()
dy/dx w.r.t. : weight foreign

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0069641   .0006314   -11.03   0.000    -.0082016   -.0057266
     foreign |    -2.2035   1.059246    -2.08   0.038    -4.279585   -.1274157
------------------------------------------------------------------------------
tchakravarty
fuente
Creo que tu expresión para ΔXkpara el caso regresor discreto está mal. Estás tomando la diferencia de derivada dePAG[Y=1], pero debería ser la diferencia de PAG[Y=1]. Debería ser el segundo término del RHS, pero sin el signo negativo.
Ravi
1

Además, y más simplemente, el coeficiente en una regresión probit se puede interpretar como "un aumento de una unidad en la edad corresponde a un βunsolmiaumento en la puntuación z para la probabilidad de estar en unión "( ver enlace ).

. webuse union

. keep union age grade

. probit union age grade

Iteration 0:   log likelihood =  -13864.23  
Iteration 1:   log likelihood = -13796.359  
Iteration 2:   log likelihood = -13796.336  
Iteration 3:   log likelihood = -13796.336  

Probit regression                               Number of obs     =     26,200
                                                LR chi2(2)        =     135.79
                                                Prob > chi2       =     0.0000
Log likelihood = -13796.336                     Pseudo R2         =     0.0049

------------------------------------------------------------------------------
       union |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |   .0051821   .0013471     3.85   0.000     .0025418    .0078224
       grade |   .0373899   .0035814    10.44   0.000     .0303706    .0444092
       _cons |  -1.404697   .0587797   -23.90   0.000    -1.519903   -1.289491
------------------------------------------------------------------------------

Entonces hazlo

predict yhat

Y verá que para obs 1, el valor ajustado es equivalente al βunsolmi20+βsolrunremi12+βConortes. Conéctelo a la normal()función para devolver la probabilidad correspondiente:

di normal(.0051821*20 + .0373899*12 + -1.404697)
.19700266

Por lo tanto, un aumento de una unidad en la edad corresponde a unβunsolmi aumento en la puntuación z de la probabilidad de estar en la unión.

Bryan
fuente