Supongamos que observo vectores variables independientes y y la variable dependiente . Me gustaría ajustar un modelo de la forma: donde es una función dos veces diferenciable de valor positivo, \ sigma es un parámetro de escala desconocido y \ epsilon es una variable aleatoria gaussiana de media unidad y varianza unitaria (se supone que es independiente de \ vec {x} y \ vec {z} ). Esto es esencialmente la configuración de la prueba de heterocedasticidad de Koenker (al menos hasta donde yo entiendo).→ z yy= → x ⊤ → β 1 +σg( → z ⊤ → β 2 )ϵ,gσϵ → x → z
Tengo de observaciones de e , y me gustaría estimar y . Sin embargo, tengo algunos problemas:
- No estoy seguro de cómo plantear el problema de estimación como algo así como mínimos cuadrados (supongo que hay un truco bien conocido). Mi primera suposición sería algo como
pero yo No estoy seguro de cómo resolver eso numéricamente (quizás un método iterativo cuasi-Newton podría hacer).
- Suponiendo que pueda plantear el problema de una manera sensata y encontrar algunas estimaciones , me gustaría conocer la distribución de las estimaciones para que, por ejemplo , pueda realizar pruebas de hipótesis. Estaría bien con probar los dos vectores de coeficientes por separado, pero preferiría alguna forma de probar, por ejemplo , para .
Respuestas:
En un contexto ligeramente más general con un vector -dimensional de -Observaciones (las respuestas, o variables dependientes), un matriz de -Observaciones (covariables o variables dependientes) y los parámetros tales como entonces la probabilidad de registro negativo es En la pregunta del OP, es diagonal conY n y X n×p x θ=(β1,β2,σ) Y∼N(Xβ1,Σ(β2,σ)) Σ(β2,σ)Σ(β
La última sugerencia me atrae porque se basa en soluciones que ya conozco bien. Además, la primera iteración es algo que consideraría hacer de todos modos. Es decir, primero calcule una estimación inicial de por mínimos cuadrados ordinarios, ignorando la posible heterocedasticidad, y luego ajuste una gamma glm a los residuos cuadrados para obtener una estimación inicial de solo para verificar si el modelo más complicado parece valioso. Las iteraciones que incorporan la heterocedasticidad en la solución de mínimos cuadrados como pesos podrían mejorar la estimación.β 2 -β1 β2 −
Con respecto a la segunda parte de la pregunta, probablemente consideraría calcular un intervalo de confianza para la combinación lineal utilizando asintóticos MLE estándar (comprobando con simulaciones que funcionan los asintóticos) o mediante bootstrapping.wT1β1+wT2β2
Editar: Por asintóticos MLE estándar me refiero a usar la aproximación normal multivariada a la distribución del MLE con la matriz de covarianza de la información inversa de Fisher. La información de Fisher es, por definición, la matriz de covarianza del gradiente de . Depende en general de los parámetros. Si puede encontrar una expresión analítica para esta cantidad, intente conectar el MLE. Como alternativa, puede estimar la información de Fisher por la información de Fisher observada , que es la arpillera de en el MLE. Su parámetro de interés es una combinación lineal de los parámetros en los dosl β ( y i , x i , z i )l l β -vectores, por lo tanto, a partir de la aproximación normal multivariada de la MLE puede encontrar una aproximación normal de la distribución de estimadores como se describe aquí . Esto le proporciona un error estándar aproximado y puede calcular intervalos de confianza. Está bien descrito en muchos libros de estadística (matemática), pero una presentación razonablemente accesible que puedo recomendar es In All Likelihood de Yudi Pawitan. De todos modos, la derivación formal de la teoría asintótica es bastante complicada y se basa en una serie de condiciones de regularidad, y solo proporciona una asintótica válida.distribuciones Por lo tanto, en caso de duda, siempre haría algunas simulaciones con un nuevo modelo para verificar si puedo confiar en los resultados para parámetros realistas y tamaños de muestra. El arranque simple, no paramétrico, en el que se muestras de los triples del conjunto de datos observado con reemplazo, puede ser una alternativa útil si el procedimiento de ajuste no consume demasiado tiempo.(yi,xi,zi)
fuente