Pruebalo

8

Los problemas estadísticos que involucran intervalos de confianza para una media poblacional se pueden enmarcar en términos de la siguiente función de ponderación :

w(α,n)tn1,α/2nfor 0<α<1 and n>1.

Por ejemplo, el clásico clásico 1α El intervalo de confianza de nivel para la media de una superpoblación infinita se puede escribir como:

CI(1α)=[x¯n±w(α,n)sn].

Es trivial establecer los límites. limα0w(α,n)=y usando la función cuantil de la distribución T. En el contexto de los intervalos de confianza, esto nos dice que el intervalo se reduce a un solo punto a medida que disminuimos el nivel de confianza, y aumenta a toda la línea real a medida que aumentamos el nivel de confianza. Otra propiedad intuitiva que debería mantenerse es que el intervalo se reduce a un solo punto a medida que obtenemos más y más datos, lo que significa que:limα1w(α,n)=0

limnortew(α,norte)=0.

Pregunta: Proporcione una prueba de esta última propiedad de la función de ponderación.


Más información: Para cualquier lector matemático que no esté familiarizado con los puntos críticos de la distribución T , el valor es una función de definida por la ecuación implícita:tnorte-1,α/ /2norte

α2=1(norte-1)πΓ(norte2)Γ(norte-12)tnorte-1,α/ /2(1+r2norte-1)-norte/ /2rer.
Ben - Restablece a Monica
fuente
2
¿No es esto trivial debido al hecho de que los estudiantes convergen a una variación total normal? El numerador va a la constante . zα/2
chico
1
@guy: lo que constituye "trivial" depende del nivel de la persona que está preguntando. La razón por la que hago esta pregunta es que este es un problema que he planteado a un par de estudiantes de posgrado en mi enseñanza, y quiero ver qué tipo de pruebas encuentran las personas en este sitio (para poder comparar esto con el tipos de respuestas dadas por los estudiantes). Los estudiantes de posgrado generalmente tienen una idea aproximada de cómo abordar la prueba, pero luchan con los detalles. La mayoría intenta mostrar e ir desde allí, pero otros intentan resolverlo estableciendo un límite en la integral. tn1,α/2zα/2<
Ben - Restablece a Monica
(También espero ver la prueba más elegante, como una buena forma de presentar el resultado).
Ben - Restablece a Monica el
2
Me interesaría ver cuán elegante alguien puede obtener esto. Opinión personal, pero yo diría que usar las densidades no es elegante porque trae una estructura adicional que no es necesaria. La prueba en mi respuesta tiene dos lecciones importantes. Primero, la propuesta es un poco útil de teoría de la probabilidad y puede dar alguna idea de cómo se comportan los DF. En segundo lugar, la técnica de prueba (que puede reformularse en términos de números de cobertura) es muy útil para probar muchas cosas.
chico

Respuestas:

4

Prueba de la desigualdad de Chebyshev

Aquí hay una prueba usando la desigualdad de Chebyshev .Pr(|T|kσ)1k2

Si rellenamos σtν=νν2 y establecemos entonces tenemos un límite1/k2=α=Pr(|T|tν,α/2)

Pr(|T|νν21α)Pr(|T|tν,α/2)

por lo tanto, estará limitado anteriormente portν,α/2

tν,α/ /2νν-21α

agregando el límite inferior obvio y dividido porν+1

0 0tnorte-1,α/ /2ν+1νν+1(ν-2)1α

que exprime a cero paratnorte-1,α/ /2/ /nortenorte

Sexto Empírico
fuente
Por lo general, evito los comentarios de "buena respuesta", ¡pero este es realmente elegante! (+1 obviamente!)
usεr11852
1
@ usεr11852 puede que le guste mi prueba geométrica donde la distribución de la estadística t está relacionada con la distribución de un ángulo en el espacio n.
Sextus Empiricus
4

Estoy seguro de que hay una manera más fácil de hacer esto, pero el resultado es inmediato de lo siguiente:

Proposición: Sea una función de distribución continua y una secuencia de funciones de distribución tal que débilmente (es decir, en distribución). Entonces uniformemente enFFnFnFFn(x)F(x)x .

Prueba: Usando continuidad y monotonicidad, para cualquier número natural podemos seleccionar modo que (tomando y ). Por convergencia débil y el hecho de que es continua, . Para cualquier , encuentre un intervalo contenga y observe que . Por lo tanto, porquemx0,x1,,xmF(xj)=j/mx0=xm=FFn(xj)F(xj)y[xj1,xj]y|Fn(y)F(y)|supj|Fn(xj)F(xj)|+|F(xj)F(xj1)|1mlim¯nsupy|Fn(y)F(y)|1mmfue arbitrario obtenemos .supy|Fn(y)F(y)|0

A continuación, es una aplicación bien conocida del teorema de Slutsky que la converge en distribución a una distribución normal estándar. El resultado anterior implica que , es decir, . Aplicando la función de cuantil normal a ambos lados, obtenemos .tn1Fn(tn1,α)F(tn1,α)0F(tn1,α)αtn1,αzα

Por lo tanto, implica para cualquier (en particular, ).tn1,αzαtn1,αg(n)0g(n)g(n)=norte

chico
fuente
3

Prueba geométrica

Vista geométrica

Considere la muestra observada como un punto en el espacio euclidiano n-dimensional y la estimación de la media como la proyección de una observación en la línea del modelo .x1,x2,...,xnx1=x2=...=xn=x¯

La puntuación t se puede expresar como la relación de dos distancias en este espacio

  • la distancia entre el punto proyectado y la población significa
    n(x¯μ)
  • la distancia entre este punto y la observación
    i=1n(x^xi)2

Esto está relacionado con la tangente del ángulo entre la observación y la línea en la que se proyecta.

tn1=n(x¯μ)i=1n(x^xi)2=1tanθ

Bosquejo geométrico

Equivalencia de distribución t y distribución angular

En esta vista geométrica, la probabilidad de que la puntuación t sea mayor que algún valor es equivalente a la probabilidad de que el ángulo sea menor que algún valor:

Pr(|T|>tn1,α/2)=2Pr(θθν,α)=α

O

tn1,α/2n1=1tanθν,α

Se podría decir que la puntuación t se relaciona con el ángulo de observación con la línea del modelo teórico. Para puntos fuera del intervalo de confianza (entonces está más lejos de y el ángulo será más pequeño) el ángulo estará por debajo de algún límite . Este límite cambiará con más observaciones. Si el límite de este ángulo va a 90 grados para grande (la forma del cono se vuelve más plana, es decir, menos puntiaguda y larga), entonces esto significa que el tamaño del intervalo de confianza se vuelve más pequeño y se acerca cero.μx¯θν,αθν,αn

ángulo vs t

Distribución angular como área relativa de la tapa de una esfera n

Debido a la simetría de la distribución de probabilidad conjunta de variables independientes distribuidas normales, cada dirección es igualmente probable y la probabilidad de que el ángulo esté dentro de una determinada región es igual al área relativa de la tapa de una esfera n.

El área relativa de este n-cap se encuentra integrando el área de un n-frustum :

2Pr(θθc)=211+tan(θc)21(1x2)n32B(12,n12)dx=11+tan(θc)21t0.5(1t)n32B(12,n12)dt=I11+tan(θc)2(12,n12)

donde es la función beta incompleta regularizada superior.Ix(,)

Límite de ángulo

Si va a 90 grados para entonces va a cero.θnorte,αnortetnorte-1,α/ /2/ /norte

O una declaración inversa: para cualquier ángulo menor de 90 grados, el área relativa de ese ángulo en una esfera n, disminuye a cero cuando va al infinito.norte

Intuitivamente, esto significa que toda el área de una esfera n se concentra en el ecuador a medida que la dimensión aumenta hasta el infinito.norte

Cuantitativamente podemos mostrar esto usando la expresión

una1t-0,5(1-t)norte-32si(12,norte-12)ret<una1(1-una)norte-32si(12,norte-12)ret=(1-una)norte-12si(12,norte-12)=L(norte)

y considere la diferencia entre y .L(norte+2)L(norte)

En algún momento, la disminución en el denominador se hará cargo de la disminución en el numerador y la función disminuye a cero para hasta el infinito.

si(12,X+1)si(12,X)=XX+12
(1-una)norte+12(1-una)norte-12=1-una
L(norte)norte
Sexto Empírico
fuente
1

Tenemos

α2=tnorte-1,α/ /2limnorte1(norte-1)πΓ(norte2)Γ(norte-12)(1+r2norte-1)-norte/ /2rer=tnorte-1,α/ /212πmi-12r2rer=1-Φ(tnorte-1,α/ /2)1-[12+φ(tnorte-1,α/ /2)(tnorte-1,α/ /2+(tnorte-1,α/ /2)33+(tnorte-1,α/ /2)5 515+...)]

lo que implica que el segundo término entre paréntesis puede ser como máximo ya que el máximo puede ser . Tenga en cuenta que es el pdf de distribución normal. Esta aproximación también se basa en esto .12α1φ(X)

Entonces

0 0<α1+2φ(tnorte-1,α/ /2)(tnorte-1,α/ /2+(tnorte-1,α/ /2)33+(tnorte-1,α/ /2)5 515+...)<1
guerhuerh
fuente
Bienvenido al sitio, @guerhuerh. Considere registrar su cuenta y convertirse en un miembro habitual aquí (hay información en la sección Mi cuenta de nuestro centro de ayuda ). Nos encantaría tenerte. Si lo desea, puede realizar nuestro recorrido , que tiene información para nuevos usuarios.
gung - Restablecer Monica
2
Este es un enfoque interesante, pero no está claro para mí cómo justifica el primer paso (donde ha agregado la operación de límite dentro de la integral). Esto da una ecuación implícita para que es falsa. tnorte-1,α/ /2
Ben - Restablece a Monica el
@Ben: ¿No ? limnorteα2=α2
PEV
@PEV: Sí, pero el lado derecho debe tener el límite fuera de la integral, no dentro de ella. Dado que los límites en la integral dependen de el lado derecho es actualmente una función de , por lo que no es igual a . nortenorteα/ /2
Ben - Restablece a Monica el
@PEV: Creo que el método podría modificarse separando la integral en dos partes, una que reemplaza el límite inferior con y otra que da el resto. El primero entonces convergería a lo que ya se muestra, y luego tendríamos que mostrar que el segundo converge a cero. Como dije, creo que este es un enfoque interesante. Puede tener mérito como método, y puede modificarse para que sea correcto, pero actualmente es incorrecto. zα/ /2
Ben - Restablece a Monica el