Este es un problema de la "VII Olimpiada de Estudiantes de Kolmogorov en Teoría de la Probabilidad":
Dada una observación de una distribución con ambos parámetros desconocidos, proporcione un intervalo de confianza para con un nivel de confianza de al menos 99%.
Me parece que esto debería ser imposible. Tengo la solución, pero aún no la he leído. ¿Alguna idea?
Publicaré la solución en un par de días.
[Edición de seguimiento: solución oficial publicada a continuación. La solución de Cardinal es más larga, pero ofrece un mejor intervalo de confianza. Gracias también a Max y Glen_b por su aporte.]
probability
normal-distribution
confidence-interval
variance
Jonathan Christensen
fuente
fuente
Respuestas:
Visto a través del lente de las desigualdades de probabilidad y las conexiones con el caso de observación múltiple, este resultado podría no parecer tan imposible o, al menos, podría parecer más plausible.
Deje con y desconocido. Podemos escribir para .μ σ 2 X = σ Z + μ Z ∼ N ( 0 , 1 )X∼N(μ,σ2) μ σ2 X=σZ+μ Z∼N(0,1)
Un motivo de optimismo
Recuerde que en el caso , con , el intervalo de confianza típico para es donde es la cuantil -level de la chi-cuadrado con grados de libertad. Esto, por supuesto, vale para cualquier . Si bien este es el intervalo más popular (llamado intervalo de cola igual por razones obvias), ¡no es el único ni siquiera el de menor ancho! Como debería ser evidente, otra selección válida es T = ∑ n i = 1 ( X i - ˉ X ) 2 ( 1 - α ) σ 2 ( Tn≥2 T=∑ni=1(Xi−X¯)2 (1−α) σ2 q k , a a k μ ( 0 , T
Desde entonces, , luego también tiene una cobertura de al menos . ( 0 , ∑ n i = 1 X 2 iT≤ ∑nortei = 1X2yo ( 1 - α )
Visto desde esta perspectiva, podríamos ser optimistas de que el intervalo en el reclamo principal es verdadero para . La principal diferencia es que no existe una distribución chi-cuadrado de cero grados de libertad para el caso de una sola observación, por lo que debemos esperar que el uso de un cuantil de un grado de libertad funcione.n = 1
Medio paso hacia nuestro destino ( Explotando la cola derecha )
Antes de sumergirnos en una prueba del reclamo principal, primero veamos un reclamo preliminar que no es tan fuerte o satisfactorio estadísticamente, pero que tal vez da una idea adicional de lo que está sucediendo. Puede pasar a la prueba de la reclamación principal a continuación, sin mucha (si alguna) pérdida. En esta sección y en la siguiente, las pruebas, aunque ligeramente sutiles, se basan solo en hechos elementales: monotonicidad de probabilidades, y simetría y unimodalidad de la distribución normal.
Reclamo auxiliar : es un intervalo de confianza para siempre que . Aquí es el cuantil nivel de una normal estándar.( 1 - α ) σ 2 α > 1 / 2 z α α[ 0 , X2/ z2α) ( 1 - α ) σ2 α > 1 / 2 zα α
Prueba . ypor simetría, entonces en lo que sigue podemos tomar sin pérdida de generalidad. Ahora, para y , y así con , vemos que Esto funciona solo para , ya que eso es lo que se necesita para .El | σ Z + μ | d = | - σ Z + μ | μ ≥ 0 θ ≥ 0 μ ≥ 0 P ( | X | > θ ) ≥ P ( X > θ ) = P ( σ Z + μ > θ ) ≥ P ( ZEl | XEl | = | -XEl | El | σZ+ μ | =reEl | -σZ+ μ | μ ≥ 0 θ ≥ 0 μ ≥ 0 θ = z α σ P ( 0 ≤ σ 2 < X 2 / z 2 α ) ≥ 1 - α
Esto prueba el reclamo auxiliar. Si bien es ilustrativo, es insatisfactorio desde una perspectiva estadística, ya que requiere un absurdamente grande para funcionar.α
Probar el reclamo principal
Un refinamiento del argumento anterior conduce a un resultado que funcionará para un nivel de confianza arbitrario. Primero, tenga en cuenta que Establezca y . Entonces, Si podemos mostrar que el lado derecho aumenta en por cada fijo , entonces podemos emplear un argumento similar al del argumento anterior. Esto es al menos plausible, ya que nos gustaría creer que si la media aumenta, entonces es más probable que veamos un valor con un módulo que excedea = μ / σ ≥ 0 b = θ / σ ≥ 0 P ( | Z + a | > b ) = Φ ( a - b ) + Φ ( - a - b )
Establezca . Entonces Tenga en cuenta que y para positivo , está disminuyendo en . Ahora, para , es fácil ver que . Estos hechos en conjunto implican fácilmente que para todos y cualquier fijo .f ′ b ( a ) = φ ( a - b ) - φ ( - a - b ) = φ ( a - b ) - φ ( a + b )Fsi( a ) = Φ ( a - b ) + Φ ( - a - b ) f ′ b ( 0 ) = 0 u φ
Por lo tanto, hemos demostrado que para y ,a ≥ 0 b ≥ 0
Desentrañando todo esto, si tomamos , obtenemos que establece el reclamo principal.θ = qα--√σ
Comentario final : una lectura cuidadosa del argumento anterior muestra que usa solo las propiedades simétricas y unimodales de la distribución normal. Por lo tanto, el enfoque funciona de manera análoga para obtener intervalos de confianza de una sola observación de cualquier familia simétrica de escala de ubicación unimodal, por ejemplo, distribuciones de Cauchy o Laplace.
fuente
¡Hora de seguir! Aquí está la solución que me dieron:
El intervalo de confianza (que es muy amplio) es ligeramente conservador en la simulación, sin cobertura empírica (en 100,000 simulaciones) inferior al 99,15%, ya que varié el CV en muchos órdenes de magnitud.
A modo de comparación, también simulé el intervalo de confianza del cardenal. Debo señalar que el intervalo del cardenal es bastante más estrecho: en el caso del 99%, su resultado es de aproximadamente , a diferencia del en la solución provista. La cobertura empírica está justo en el nivel nominal, nuevamente en muchos órdenes de magnitud para el CV. Entonces su intervalo definitivamente gana.6300 X2 10000 X2
No he tenido tiempo de mirar detenidamente el artículo publicado por Max, pero planeo mirar eso y puedo agregar algunos comentarios al respecto más tarde (es decir, no antes de una semana). Ese documento afirma un intervalo de confianza del 99% de , que tiene una cobertura empírica ligeramente menor (alrededor del 98.85%) que la cobertura nominal para CV grandes en mis breves simulaciones.( 0 , 4900 X2)
fuente
pchisq(1/4900,1,lower.tail=F)
enR
los rendimientos0.9886
, muy cerca de sus resultados de la simulación para el intervalo.Los CI presumiblemente.( 0 , ∞ )
fuente