Digamos que sabemos la media de una distribución dada. ¿Afecta esto la estimación del intervalo de la varianza de una variable aleatoria (que de otro modo se calcula utilizando la varianza de la muestra)? Como en, ¿podemos obtener un intervalo más pequeño para el mismo nivel de confianza?
normal-distribution
confidence-interval
variance
Martianwars
fuente
fuente
Respuestas:
No estoy completamente seguro de que mi respuesta sea correcta, pero diría que no hay una relación general. Aquí está mi punto:
Estudiemos el caso donde el intervalo de confianza de la varianza se entiende bien, a saber. muestreo de una distribución normal (como se indica en la etiqueta de la pregunta, pero no realmente la pregunta en sí). Vea la discusión aquí y aquí .
Un intervalo de confianza paraσ2 se desprende del pivote T=nσ^2/σ2∼χ2n−1 , dónde σ^2=1/n∑i(Xi−X¯)2 . (Esta es solo otra forma de escribir la expresión posiblemente más familiarT=(n−1)s2/σ2∼χ2n−1 , dónde s2=1/(n−1)∑i(Xi−X¯)2 .)
Así tenemos
(Observe de pasada que para cualquier variación estima que, como la está sesgada, los cuantiles generarán un ci con la probabilidad de cobertura correcta, pero no serán óptimos, es decir, no serán los más cortos posibles. para que el intervalo sea lo más corto posible, necesitamos que la densidad sea idéntica en el extremo inferior y superior del ci, dadas algunas condiciones adicionales como la unimodalidad. No sé si usar ese ci óptimo cambiaría las cosas en esta respuesta).χ2
Como se explica en los enlaces, , donde usa lo conocido media. Por lo tanto, obtenemos otro intervalo de confianza válido Aquí, y serán cuantiles de la 2_n.T′= ns20 0/ /σ2∼χ2norte s20 0=1norte∑yo(Xyo- μ)2
Los anchos de los intervalos de confianza son y El ancho relativo es Sabemos que como la media muestral minimiza la suma de las desviaciones al cuadrado. Más allá de eso, veo pocos resultados generales con respecto al ancho del intervalo, ya que no estoy al tanto de resultados claros sobre cómo se comportan las diferencias y los productos de los cuantiles superiores e inferiores a medida que aumentamos los grados de libertad en uno (pero vea la figura a continuación).
Por ejemplo, dejando
Usando el siguiente código, realicé un pequeño estudio de simulación que sugiere que el intervalo basado en ganará la mayor parte del tiempo. (Ver el enlace publicado en la respuesta de Aksakal para una racionalización de este resultado en una gran muestra).s20 0
La probabilidad parece estabilizarse en , pero no conozco una explicación analítica de muestras finitas:norte
La siguiente figura traza contra , revelando (como sugeriría la intuición) que la relación tiende a 1. Como, además, para grande, la diferencia entre los anchos de los dos cis será por lo tanto desaparecer como . (Vea nuevamente el enlace publicado en la respuesta de Aksakal para una racionalización de este resultado en una gran muestra).rnorte norte X¯→pagsμ norte n → ∞
fuente
Permítanme primero configurar el problema. Sabemos que la población significa. Este es un punto muy importante al principio, porque sin él no tendremos una respuesta significativa.
Te explicaré por qué. Digamos que tenemos una muestra y no sabemos la media de la población. Tenemos un estimador habitual de la varianza:
Ahora, nos dicen que la media de la población es . Nuestro primer instinto es conectarlo al estimador de varianza:μ
¡Tenga en cuenta que ahora es un estimador diferente! Tiene un denominador diferente, etc. Tiene una varianza diferente .
Sin embargo, ¿es correcto comparar y ? No, no es.Var[σ] Var[σ′]
Tenemos que comparar y . En otras palabras, tenemos que comparar la varianza de estos dos estimadores condicional al conocimiento de la media de la población. De lo contrario, caeremos en la paradoja de @ Scortchi.Var[σ|E[xi]=μ] Var[σ′|E[xi]=μ]
Cuando obtenga nueva información, es decir, , ¡debe incluirla en la estimación de ! Esto resuelve la paradoja de @ Scortchi en su comentario directamente. Las ecuaciones que vi hasta ahora en las respuestas no incluyen el conocimiento de en el IC o la varianza del estimador de varianza . En el ejemplo de @ Scortchi sabiendo que conduciría a una revisión de CI de .E[xi]=μ Var[σ] μ σ X¯> > Μ σ
Por lo tanto, mi respuesta aquí sigue la configuración que acabo de describir.
Sí, el intervalo de confianza habría sido más estrecho.
Filosóficamente, conocer la media de la población es una información adicional, por lo que la incertidumbre debe ser menor en este caso.
Ejemplo: si su distribución es Poisson, entonces la varianza es igual a la media. Por lo tanto, saber significa que también conoce la varianza, y el intervalo de confianza se reduce a un punto. No hay intervalo
ACTUALIZACIÓN: Mire este documento : "Estimación de una varianza de la población con la media conocida" de Zhang, 1996. Compara la estimación estándar de la varianza vs el que usa el conocimiento de la media de la población . Llega a la misma conclusión: la varianza de la última estimación es menor que la de la primera, es decir, la estimación del intervalo de confianza de la varianza sería más estrecha. También muestra que la ventaja desaparece cuando el tamaño de la muestra tiende al infinito.1n - 1∑yo(Xyo-X¯)2 1norte∑yo(Xyo- μ)2
Creo que este documento es la respuesta definitiva a su pregunta.
fuente
Extendiendo un poco la respuesta de @Cristoph Hanck , y adaptando su código ...
Supongamos que el Sr. A ignora la verdadera media o las estadísticas, y el Sr. B ignora ninguno de los dos. Puede parecer extraño, incluso injusto, que el Sr. A pueda obtener un intervalo de confianza más corto para la varianza usando el pivote que el Sr. B usando el pivote . Pero a la larga, el Sr. B gana en lugar de un sentido fuerte: sus intervalos de confianza son estocásticamente estrecho-para cualquier ancho es que quiere especificar, la proporción de los IC del Sr. B estrechos que es mayor que la proporción de Sr. A de.T T′ w w
La recopilación conjunta del subconjunto de casos en los que el CI del Sr. A es más estrecho muestra que en estos tiene una cobertura más baja (alrededor del 91%); pero lo paga con una mayor cobertura (alrededor del 96%) en el subconjunto de casos donde su intervalo se amplía, obteniendo la cobertura correcta (95%) en general. Por supuesto, el Sr. A no sabe cuándo su CI está en qué subconjunto. Y un astuto señor C que conoce la verdadera media y elige o acuerdo con lo cual da como resultado el IC más estrecho eventualmente quedará expuesto cuando sus intervalos no logren mantener su supuesta cobertura del 95%.T T′
fuente
No puedo comentar, pero la afirmación general de Aksakal "saber la media de la población es una información adicional, por lo que la incertidumbre debe ser menor en este caso" no es evidente.
En el caso normalmente distribuido, el estimador de máxima verosimilitud de la varianza cuandoμ es desconocido:
tiene una varianza uniformemente menor que
para cualquier valor deμ , σ
fuente