Supongamos que es un estimador imparcial de . Entonces, por supuesto, . θE[ θ |θ]=θ
¿Cómo se explica esto a un laico? En el pasado, lo que he dicho es que si promedias un montón de valores de , a medida que el tamaño de la muestra aumenta, obtienes una mejor aproximación de . theta
Para mí, esto es problemático. Creo que lo que realmente estoy describiendo aquí es este fenómeno de ser asintóticamente imparcial, en lugar de ser únicamente imparcial, es decir, donde \ hat {\ theta} probablemente depende de n .
Entonces, ¿cómo se explica lo que un estimador imparcial es para un laico?
bias
asymptotics
unbiased-estimator
estimators
communication
Clarinetista
fuente
fuente
Respuestas:
Técnicamente, lo que está describiendo cuando dice que su estimador se acerca al valor verdadero a medida que crece el tamaño de la muestra es (como otros han mencionado) la consistencia o convergencia de los estimadores estadísticos. Esta convergencia puede ser convergencia en probabilidad, lo que dice que por cada , o casi convergencia segura que dice que . Observe cómo el límite está realmente dentrolimn→∞P(|θ^n−θ|>ϵ)=0 ϵ>0 P(limn→∞|θ^n−θ|>ϵ)=0 La probabilidad en el segundo caso. Resulta que esta última forma de convergencia es más fuerte que la otra, pero ambas significan esencialmente lo mismo, y es que la estimación tiende a acercarse más y más a lo que estamos estimando a medida que recolectamos más muestras.
Un punto sutil aquí es que incluso cuando sea en probabilidad o casi con toda seguridad, es no cierto en general que , por lo que la coherencia no implica imparcialidad asintótica como usted sugiere. Debe tener cuidado al moverse entre secuencias de variables aleatorias (que son funciones) a secuencias de expectativas (que son integrales).θ^n→θ limn→∞E(θ^n)=θ
Dejando a un lado todas las cosas técnicas, imparcial solo significa que . Entonces, cuando se lo explique a alguien, simplemente diga que si el experimento se repitiera en condiciones idénticas muchas veces, el valor promedio de la estimación estaría cerca del valor verdadero.E(θ^n)=θ
fuente
No estoy seguro si confundes consistencia e imparcialidad.
Consistencia: cuanto mayor es el tamaño de la muestra, menor es la varianza del estimador.
Imparcialidad: el valor esperado del estimador es igual al valor verdadero de los parámetros
Entonces tu oración
No es correcto. Incluso si el tamaño de la muestra se vuelve infinito, un estimador imparcial seguirá siendo un estimador imparcial, por ejemplo, si estima la media como "media +1", puede agregar mil millones de observaciones a su muestra y su estimador aún no le dará el valor verdadero.
Aquí puede encontrar una discusión más profunda sobre la diferencia entre consistencia e imparcialidad.
¿Cuál es la diferencia entre un estimador consistente y un estimador imparcial?
fuente
@Ferdi ya proporcionó una respuesta clara a su pregunta, pero hagámoslo un poco más formal.
Deje sea su muestra de variables aleatorias independientes e idénticamente distribuidos de distribución . Está interesado en estimar una cantidad desconocida pero fija , utilizando el estimador como una función de . Como es una función de variables aleatorias, estimarX1,…,Xn F θ g X1,…,Xn g
También es una variable aleatoria. Definimos sesgo como
el estimador es imparcial cuando .Eθ(θ^n)=θ
Diciéndolo en inglés simple: estamos tratando con variables aleatorias , por lo tanto, a menos que sea degenerado , si tomamos muestras diferentes, podríamos esperar observar datos diferentes y estimaciones tan diferentes. No obstante, podríamos esperar que en diferentes muestras "en promedio", estimado sería "correcto" si el estimador es imparcial. Por lo tanto, no siempre sería correcto, pero "en promedio" sería correcto. Simplemente no siempre puede ser "correcto" debido a la aleatoriedad asociada con los datos.θ^n
Como otros ya notaron, el hecho de que su estimación se "acerca" a la cantidad estimada a medida que su muestra crece, es decir, que converge en la probabilidad
tiene que ver con la consistencia de los estimadores , no con la imparcialidad. La imparcialidad por sí sola no nos dice nada sobre el tamaño de la muestra y su relación con las estimaciones obtenidas. Además, los estimadores imparciales no siempre están disponibles y no siempre son preferibles a los sesgados. Por ejemplo, después de considerar el equilibrio de sesgo-varianza , puede considerar usar un estimador con mayor sesgo, pero con una varianza menor, por lo que "en promedio" estaría más alejado del valor real, pero con mayor frecuencia (menor varianza) los estimados estar más cerca del valor verdadero, entonces en caso de estimador imparcial.
fuente
Primero debe distinguir el sesgo de malentendido del sesgo estadístico, especialmente para una persona laica.
La elección de decir usando la mediana, la media o la moda como su estimador para el promedio de la población , a menudo contiene un sesgo de creencias de teoría política, religiosa o científica. El cálculo de qué estimador es la mejor forma de promedio es de un tipo diferente al aritmético que afecta el sesgo estadístico.
Una vez que haya superado el sesgo de selección del método, puede abordar los posibles sesgos en el método de estimación. Primero, debe elegir un método que pueda tener un sesgo y un mecanismo que conduzca fácilmente hacia ese sesgo.
Puede ser más fácil usar un punto de vista de dividir y conquistar donde se vuelve obvio a medida que el tamaño de la muestra se reduce, la estimación se vuelve claramente sesgada. Por ejemplo, el factor n-1 (vs factor 'n') en los estimadores de dispersión de muestra se vuelve obvio cuando n cae de 3 a 2 a 1.
Todo depende de cuán 'endecha' sea la persona.
fuente