Prueba de Wald en regresión (OLS y GLM): distribución t- vs. z

22

Yo entiendo que la prueba de Wald para los coeficientes de regresión se basa en la propiedad después de que mantiene asintóticamente (por ejemplo Wasserman (2006): Todos Estadística , páginas 153, 214-215): Dondeβdenota el coeficiente de regresión estimado,^SE(β)denota el error estándar del coeficiente de regresión yβ0es el valor de interés (β0es generalmente de 0 para probar si el coeficiente es significativamente diferente de 0). Por lo tanto, laprueba detamañoαWald es: rechazarH0cuando| W| >zα/

(β^β0)se^(β^)N(0,1)
β^se^(β^)β0β0αH0 donde W= β|W|>zα/2
W=β^se^(β^).

Pero cuando realiza una regresión lineal con lmen R, se usa un valor lugar de un valor z para probar si los coeficientes de regresión difieren significativamente de 0 (con ). Además, la salida de en R a veces da valores zy otras veces t como estadísticas de prueba. Aparentemente, los valores z se usan cuando se supone que el parámetro de dispersión se conoce y los valores t se usan cuando se estima el parámetro de dispersión (vea este enlace ).tzsummary.lmglmztzt

¿Podría alguien explicar por qué a veces se usa una distribución para una prueba de Wald a pesar de que se supone que la relación del coeficiente y su error estándar se distribuye como normal normal?t

Editar después de responder la pregunta

Esta publicación también proporciona información útil para la pregunta.

COOLSerdash
fuente
2
¿Qué te hace pensar que la estadística de prueba que se informa es necesariamente una prueba de Wald?
Glen_b -Reinstate Monica el
3
Debido a que los valores - o t son siempre el coeficiente dividido por su error estándar en y . ztlmglm
COOLSerdash

Respuestas:

20

La salida del glmuso de una distribución de Poisson da un valor porque con una distribución de Poisson, la media y el parámetro de varianza son los mismos. En el modelo de Poisson, solo tiene que estimar un único parámetro ( λ ). En un lugar donde debe estimar tanto un parámetro de media como de dispersión, debería ver la distribución t utilizada.zλglmt

Para una regresión lineal estándar, se supone que el término de error se distribuye normalmente. Aquí, el parámetro de varianza tiene que ser estimado, de ahí el uso de la distribución para el estadístico de prueba. Si de alguna manera conociera la varianza de la población para el término de error, podría usar una estadística z- testtz

t

wcampbell
fuente
3

En el marco GLM, en general, la estadística de prueba W que mencionó está distribuida asintóticamente Normal , es por eso que ve en R los valores z .

Además de eso, cuando se trata de un modelo lineal, es decir, un GLM con una variable de respuesta distribuida normal, la distribución del estadístico de prueba es una t de Student , por lo que en R tiene valores t .

EdoLu
fuente