Hasta donde yo entiendo, la prueba de Wald en el contexto de la regresión logística se usa para determinar si cierta variable predictora es significativa o no. Rechaza la hipótesis nula de que el coeficiente correspondiente sea cero.
La prueba consiste en dividir el valor del coeficiente por error estándar .
Lo que me confunde es que también se conoce como puntaje Z e indica la probabilidad de que una observación determinada provenga de la distribución normal (con media cero).
logistic
z-statistic
usuario695652
fuente
fuente
Respuestas:
Las estimaciones de los coeficientes y las intersecciones en la regresión logística (y cualquier GLM) se encuentran a través de la estimación de máxima verosimilitud (MLE). Estas estimaciones se denotan con un sombrero sobre los parámetros, algo así como . Nuestro parámetro de interés se denota y generalmente es 0, ya que queremos probar si el coeficiente difiere de 0 o no. A partir de la teoría asintótica de MLE, sabemos que la diferencia entre y se distribuirá aproximadamente normalmente con media 0 (los detalles se pueden encontrar en cualquier libro de estadística matemática como Larry Wasserman Todas las estadísticas ) . Recuerde que los errores estándar no son más que theta0 theta theta0σW=( β -β 0 )θ^ θ0 θ^ θ0 desviaciones estándar de las estadísticas (Sokal y Rohlf escriben en su libro Biometry : "una estadística es cualquiera de las muchas cantidades estadísticas calculadas o estimadas", por ejemplo, la media, la mediana, la desviación estándar, el coeficiente de correlación, el coeficiente de regresión, ...). Dividir una distribución normal con media 0 y desviación estándar por su desviación estándar dará como resultado la distribución normal estándar con media 0 y desviación estándar 1. La estadística de Wald se define como (por ejemplo, Wasserman (2006): Todas las estadísticas , páginas 153, 214-215):
o
σ W2=(β-β0)2
Debido a que el parámetro de interés suele ser 0 (es decir, ), la estadística de Wald se simplifica a Que es lo que usted describió: la estimación del coeficiente dividido por su error estándar.β0=0
¿Cuándo es una y cuándo se usa un valor ?z t
La elección entre un valor o un valor depende de cómo se haya calculado el error estándar de los coeficientes. Debido a que el estadístico de Wald se distribuye asintóticamente como una distribución normal estándar, podemos usar la puntuación para calcular el valor . Cuando, además de los coeficientes, también tenemos que estimar la varianza residual, se usa un valor lugar del valor . En los mínimos cuadrados ordinarios (OLS, regresión lineal normal), la matriz de varianza-covarianza de los coeficientes es dondez t z p t z Var[β^|X]=σ2(X′X)−1 σ2 es la varianza de los residuos (que es desconocida y debe estimarse a partir de los datos) y es la matriz de diseño . En OLS, los errores estándar de los coeficientes son las raíces cuadradas de los elementos diagonales de la matriz de varianza-covarianza. Como no sabemos , tenemos que reemplazarlo por su estimación , entonces: . Ahora ese es el punto: dado que tenemos que estimar la varianza de los residuos para calcular el error estándar de los coeficientes, necesitamos usar un valor y la distribución .X σ2 σ^2=s2 ttseˆ(βj^)=s2(X′X)−1jj−−−−−−−−−√ t t
En la regresión logística (y de Poisson), la varianza de los residuos está relacionada con la media. Si , la media es y la varianza es por lo que la varianza y la media están relacionadas. En la regresión logística y de Poisson, pero no en la regresión con errores gaussianos, conocemos la varianza esperada y no tenemos que estimarla por separado. El parámetro de dispersión indica si tenemos más o menos de la varianza esperada. Si esto significa que observamos la cantidad esperada de varianza, mientras que significa que tenemos menos de la varianza esperada (llamada subdispersión) yE ( Y ) = n p Var ( Y ) = n p ( 1 - p ) ϕ ϕ = 1 ϕ < 1 ϕ > 1 z t pY∼Bin(n,p) E(Y)=np Var(Y)=np(1−p) ϕ ϕ=1 ϕ<1 ϕ>1 significa que tenemos una varianza adicional más allá de la esperada (llamada sobredispersión). El parámetro de dispersión en la regresión logística y de Poisson se fija en 1, lo que significa que podemos usar el -score. El parámetro de dispersión. En otros tipos de regresión, como la regresión lineal normal, tenemos que estimar la varianza residual y, por lo tanto, se usa un valor para calcular los valores . En , mira estos dos ejemplos:z t p
R
Regresión logística
Tenga en cuenta que el parámetro de dispersión se fija en 1 y, por lo tanto, obtenemos valores .z
Regresión lineal normal (MCO)
Aquí, tenemos que estimar la varianza residual (denotada como "error estándar residual") y, por lo tanto, usamos valores lugar de valores . Por supuesto, en muestras grandes, la distribución aproxima a la distribución normal y la diferencia no importa.z tt z t
Otra publicación relacionada se puede encontrar aquí .
fuente