Para un modelo lineal, la solución OLS proporciona el mejor estimador lineal imparcial para los parámetros.
Por supuesto, podemos cambiar un sesgo por una varianza más baja, por ejemplo, regresión de cresta. Pero mi pregunta es sobre no tener prejuicios. ¿Hay otros estimadores que se usan con cierta frecuencia, que son imparciales pero con una varianza más alta que los parámetros estimados de MCO?
Si tuviera un gran conjunto de datos, podría, por supuesto, submuestrearlo y estimar los parámetros con menos datos, y aumentar la varianza. Supongo que esto podría ser hipotéticamente útil.
Esta es más una pregunta retórica, porque cuando leí sobre estimadores AZUL, no se ofrece una alternativa peor. Supongo que proporcionar peores alternativas también podría ayudar a las personas a comprender mejor el poder de los estimadores AZULES.
Respuestas:
Un ejemplo que viene a la mente es un estimador GLS que pondera las observaciones de manera diferente, aunque eso no es necesario cuando se cumplen los supuestos de Gauss-Markov (que el estadístico puede no saber que es el caso y, por lo tanto, aplicar todavía aplicar GLS).
Considere el caso de una regresión deyi , i=1,…,n en una constante para ilustración (se generaliza fácilmente a estimadores GLS generales). Aquí, {yi} se supone que } es una muestra aleatoria de una población con mediaμ y varianzaσ2 .
Entonces, sabemos que OLS es β = ˉ y , la media de la muestra. Para enfatizar el punto de que cada observación se pondera con peso 1 / n , escribir esto como β = nβ^=y¯ 1/n β^=∑i=1n1nyi.
Es bien sabido queVar(β^)=σ2/n .
Ahora, considere otro estimador que se puede escribir comoβ~=∑i=1nwiyi,
donde los pesos son tales que ∑iwi=1 . Esto asegura que el estimador sea imparcial, ya que
E(∑i=1nwiyi)=∑i=1nwiE(yi)=∑i=1nwiμ=μ.
Su variación excederá la de OLS a menos quewi=1/n para todoi (en cuyo caso, por supuesto, se reducirá a OLS), que por ejemplo se puede mostrar a través de un Lagrangiano:
Aquí hay una ilustración gráfica de una pequeña simulación, creada con el siguiente código:
In log(s) : NaNs produced
El hecho de que los tres últimos superen a la solución OLS no está implícito de inmediato por la propiedad AZUL (al menos no para mí), ya que no es obvio si son estimadores lineales (ni sé si el MLE y Huber son imparciales).
fuente