Los problemas estadísticos que involucran intervalos de confianza para una media poblacional se pueden enmarcar en términos de la siguiente función de ponderación :
Por ejemplo, el clásico clásico El intervalo de confianza de nivel para la media de una superpoblación infinita se puede escribir como:
Es trivial establecer los límites. y usando la función cuantil de la distribución T. En el contexto de los intervalos de confianza, esto nos dice que el intervalo se reduce a un solo punto a medida que disminuimos el nivel de confianza, y aumenta a toda la línea real a medida que aumentamos el nivel de confianza. Otra propiedad intuitiva que debería mantenerse es que el intervalo se reduce a un solo punto a medida que obtenemos más y más datos, lo que significa que:
Pregunta: Proporcione una prueba de esta última propiedad de la función de ponderación.
Más información: Para cualquier lector matemático que no esté familiarizado con los puntos críticos de la distribución T , el valor es una función de definida por la ecuación implícita:
fuente
Respuestas:
Prueba de la desigualdad de Chebyshev
Aquí hay una prueba usando la desigualdad de Chebyshev .Pr(|T|≥kσ)≤1k2
Si rellenamosσtν=νν−2 y establecemos entonces tenemos un límite1/k2=α=Pr(|T|≥tν,α/2)
por lo tanto, estará limitado anteriormente portν,α/2
agregando el límite inferior obvio y dividido porν+ 1----√
que exprime a cero paratn - 1 , α / 2/ /norte--√ n → ∞
fuente
Estoy seguro de que hay una manera más fácil de hacer esto, pero el resultado es inmediato de lo siguiente:
A continuación, es una aplicación bien conocida del teorema de Slutsky que la converge en distribución a una distribución normal estándar. El resultado anterior implica que , es decir, . Aplicando la función de cuantil normal a ambos lados, obtenemos .tn−1 Fn(tn−1,α)−F(tn−1,α)→0 F(tn−1,α)→α tn−1,α→zα
Por lo tanto, implica para cualquier (en particular, ).tn−1,α→zα tn−1,αg(n)→0 g(n)→∞ g(n)=n−−√
fuente
Prueba geométrica
Vista geométrica
Considere la muestra observada como un punto en el espacio euclidiano n-dimensional y la estimación de la media como la proyección de una observación en la línea del modelo .x1,x2,...,xn x1=x2=...=xn=x¯
La puntuación t se puede expresar como la relación de dos distancias en este espacio
Esto está relacionado con la tangente del ángulo entre la observación y la línea en la que se proyecta.
Equivalencia de distribución t y distribución angular
En esta vista geométrica, la probabilidad de que la puntuación t sea mayor que algún valor es equivalente a la probabilidad de que el ángulo sea menor que algún valor:
O
Se podría decir que la puntuación t se relaciona con el ángulo de observación con la línea del modelo teórico. Para puntos fuera del intervalo de confianza (entonces está más lejos de y el ángulo será más pequeño) el ángulo estará por debajo de algún límite . Este límite cambiará con más observaciones. Si el límite de este ángulo va a 90 grados para grande (la forma del cono se vuelve más plana, es decir, menos puntiaguda y larga), entonces esto significa que el tamaño del intervalo de confianza se vuelve más pequeño y se acerca cero.μ x¯ θν,α θν,α n
Distribución angular como área relativa de la tapa de una esfera n
Debido a la simetría de la distribución de probabilidad conjunta de variables independientes distribuidas normales, cada dirección es igualmente probable y la probabilidad de que el ángulo esté dentro de una determinada región es igual al área relativa de la tapa de una esfera n.
El área relativa de este n-cap se encuentra integrando el área de un n-frustum :
donde es la función beta incompleta regularizada superior.Ix(⋅,⋅)
Límite de ángulo
Si va a 90 grados para entonces va a cero.θn , α n → ∞ tn - 1 , α / 2/ /norte--√
O una declaración inversa: para cualquier ángulo menor de 90 grados, el área relativa de ese ángulo en una esfera n, disminuye a cero cuando va al infinito.norte
Intuitivamente, esto significa que toda el área de una esfera n se concentra en el ecuador a medida que la dimensión aumenta hasta el infinito.norte
Cuantitativamente podemos mostrar esto usando la expresión
y considere la diferencia entre y .L ( n + 2 ) L ( n )
En algún momento, la disminución en el denominador se hará cargo de la disminución en el numerador y la función disminuye a cero para hasta el infinito.
fuente
Tenemos
lo que implica que el segundo término entre paréntesis puede ser como máximo ya que el máximo puede ser . Tenga en cuenta que es el pdf de distribución normal. Esta aproximación también se basa en esto .12 α 1 φ ( x )
Entonces
fuente