¿Estadísticas de pedido (p. Ej., Mínimo) de una colección infinita de variantes de chi-cuadrado?

Esta es mi primera vez aquí, así que avíseme si puedo aclarar mi pregunta de alguna manera (incluido el formato, las etiquetas, etc.). (¡Y espero poder editar más tarde!) Traté de encontrar referencias e intenté resolverme usando la inducción, pero fallé en ambas.

Estoy tratando de simplificar una distribución que parece reducirse a una estadística de orden de un conjunto infinitamente contable de variables aleatorias independientes con diferentes grados de libertad; específicamente, ¿cuál es la distribución de la º valor más pequeño entre los independientes ? $\chi^2$ $m$ $\chi^2_2,\chi^2_4,\chi^2_6,\chi^2_8,\ldots$

Me interesaría el caso especial : ¿cuál es la distribución del mínimo de (independiente) ? $m=1$ $\chi^2_2,\chi^2_4,\chi^2_6,\ldots$

Para el caso del mínimo, pude escribir la función de distribución acumulativa (CDF) como un producto infinito, pero no puedo simplificarla aún más. Utilicé el hecho de que el CDF de es (Con , esto confirma el segundo comentario a continuación sobre la equivalencia con una distribución exponencial con expectativa 2.) El CDF del mínimo se puede escribir como El primer término en el producto es solo , y el "último" término es $\chi^2_{2m}$

F_{2 m} (x) = γ (m, x / 2) / Γ (m) = γ (m, x / 2) / (m - 1)! = 1 - e^{- x / 2} \sum_{k = 0}^{m - 1} x^{k} / (2^{k} k!) .

$F_{2m}(x)=\gamma(m,x/2)/\Gamma(m)=\gamma(m,x/2)/(m-1)!=1-e^{-x/2}\sum_{k=0}^{m-1}x^k/(2^k k!).$

m = 1

$m=1$

F_{m i n} (x) = 1 - (1 - F_{2} (x)) (1 - F_{4} (x)) \dots = 1 - \prod_{m = 1}^{\infty} (1 - F_{2 m} (x))

$F_{min}(x) = 1-(1-F_2(x))(1-F_4(x))\ldots = 1-\prod_{m=1}^\infty (1-F_{2m}(x))$

= 1 - \prod_{m = 1}^{\infty} (e^{- x / 2} \sum_{k = 0}^{m - 1} \frac{x^{k}}{2^{k} k!}) .

$= 1- \prod_{m=1}^\infty \left(e^{-x/2}\sum_{k=0}^{m-1}\frac{x^k}{2^k k!}\right).$

e^{- x / 2}

$e^{-x/2}$

e^{- x / 2} \sum_{k = 0}^{\infty} x^{k} / (2^{k} k!) = 1

$e^{-x/2}\sum_{k=0}^\infty x^k/(2^k k!)=1$ . Pero no sé cómo (si es posible) simplificarlo desde allí. O tal vez un enfoque totalmente diferente es mejor.

Otro recordatorio potencialmente útil: es lo mismo que una distribución exponencial con expectativa 2, y es la suma de dos exponenciales, etc. $\chi^2_2$ $\chi^2_4$

Si alguien tiene curiosidad, estoy tratando de simplificar el Teorema 1 en este documento para el caso de regresión en una constante ( para todo ). (Tengo lugar de ya que las he multiplicado por ). $x_i=1$ $i$ $\chi^2$ $\Gamma$ $2\kappa$

distributions chi-squared exponential order-statistics minimum David M Kaplan
fuente

¿ Responde esto a tu pregunta?

mpiktas

@mpiktas: gracias por la sugerencia. Es similar, excepto que en lugar de exponenciales con diferentes parámetros de velocidad, tengo chi-cuadrados con diferentes grados de libertad (y un número infinito de ellos, no finito). Y mientras es exponencial, no lo son; son sumas de exponenciales, pero las sumas de exponenciales no son exponenciales en sí mismas. (E idealmente espero una estadística de orden general, aunque el mínimo sería un gran comienzo.)

χ_{2}^{2}

$\chi^2_2$

χ_{4}^{2}, χ_{6}^{2}, \dots

$\chi^2_4,\chi^2_6,\ldots$

David M Kaplan

Dudo que haya una forma cerrada para esto. Sin embargo, tiene una caracterización curiosa: cuando son iid Poisson ( ), , entonces es la posibilidad de que todo .

X_{k}

$X_k$

λ / 2

$\lambda/2$

k = 1, 2, \dots

$k=1,2,\ldots$

1 - F_{m i n} (λ)

$1-F_{min}(\lambda)$

X_{k} \leq k

$X_k \le k$

whuber

@whuber: Quizás no sea tan curioso cuando se piensa en términos de un proceso de Poisson, que es la formulación con la que había estado jugando. Deje que sean iid variables aleatorias, con el correspondiente proceso de Poisson de tasa . Deje que , , , etc. Entonces, son independientes y por la propiedad de incrementos independientes estacionarios de un proceso de Poisson, tener eso .

T_{1}, T_{2}, \dots

$T_1, T_2, \ldots$

E x p (1 / 2)

$\mathrm{Exp}(1/2)$

N (t) := sup {n : \sum_{i = 1}^{n} T_{i} \leq t}

$N(t) := \sup\{n: \sum_{i=1}^n T_i \leq t\}$

1 / 2

$1/2$

U_{1} = T_{1}

$U_1 = T_1$

U_{2} = T_{2} + T_{3}

$U_2 = T_2 + T_3$

U_{3} = T_{4} + T_{5} + T_{6}

$U_3 = T_4 + T_5 + T_6$

U_{i} \sim χ_{2 i}^{2}

$U_i\sim\chi_{2i}^2$

P (U_{i} \geq t) = P (N (t) \leq i)

$\mathbb{P}(U_i \geq t) = \mathbb{P}( N(t) \leq i)$

cardenal

@ Cardenal Por supuesto: esa es una buena manera de verlo. La curiosidad no está en la relación entre Poissons y Gammas; se encuentra en la descripción del evento en sí!

whuber

Respuestas:

Los ceros del producto infinito serán la unión de los ceros de los términos. Calcular el vigésimo término muestra el patrón general:

trama de ceros complejos

Esta gráfica de los ceros en el plano complejo distingue las contribuciones de los términos individuales en el producto mediante diferentes símbolos: en cada paso, las curvas aparentes se extienden aún más y se inicia una nueva curva aún más a la izquierda.

La complejidad de esta imagen demuestra que no existe una solución de forma cerrada en términos de funciones bien conocidas de análisis superior (como gammas, thetas, funciones hipergeométricas, etc.), así como las funciones elementales, como se analizó en un texto clásico como Whittaker Y Watson ).

Por lo tanto, el problema podría plantearse de manera más fructífera de manera un poco diferente : ¿qué necesita saber sobre las distribuciones de las estadísticas de pedidos? ¿Estimaciones de sus funciones características? Momentos de bajo orden? Aproximaciones a cuantiles? ¿Algo más?

whuber
fuente

¿Por qué los ceros del producto son importantes? Siento que me falta algo trivial.

mpiktas

@mp Los ceros y los polos muestran algo sobre la complejidad de la función. Las funciones racionales tienen un número finito de ellas. Las funciones elementales generalmente tienen una línea de ceros, como en , integral, para ; Las funciones "trascendentales" típicas tienen patrones de ceros ligeramente más complejos, como en todos los enteros no positivos (recíprocos de la función Gamma) o en una red de puntos (funciones theta y funciones elípticas). El complicado patrón exhibido aquí sugiere que será difícil o imposible expresar el CDF en términos de estas funciones familiares.

2 i π n

$2i\pi n$

n

$n$

\exp ()

$\exp()$

Whuber

@whuber (1/2), gracias! No sabía acerca de las diferentes clases de funciones que tienen esos diferentes patrones de ceros en el plano complejo; eso suena muy útil, y su gráfico parece responder a mi pregunta (como se plantea).

David M Kaplan

@whuber (2/2), esto verificaba un caso especial de distribución (complicada) de un estimador dado en otro artículo. Utilizaron la existencia de la distribución para justificar el uso de bootstrap; mi asesor me sugirió que tratara de aproximar la distribución. Parece que su distribución podría estar desactivada para este caso especial (donde sé cuál debería ser), así que lo consultaré con mi asesor después de la fecha límite de su concesión; pero potencialmente, estaría tratando de tomar una expansión de orden superior de la estadística de orden (dividida por ) como , en un entorno más complicado. Publicaremos nuevamente si es así; ¡gracias de nuevo!

m

$m$

m

$m$

m \to \infty

$m\to\infty$

David M Kaplan

¿Cuál es la distribución del mínimo de (independiente) ? $\chi^2_2,\chi^2_4,\chi^2_6,\ldots$

Disculpas por llegar unos 6 años tarde. Aunque es probable que el OP ahora haya pasado a otros problemas, la pregunta sigue siendo nueva, y pensé que podría sugerir un enfoque diferente.

Se nos da donde donde con pdf's : $(X_1, X_2, X_3, \dots)$ $X_i \sim \text{Chisquared}(v_i)$ $v_i= 2i$ $f_i(x_i)$

Aquí hay una gráfica del correspondiente del pdf , a medida que aumenta el tamaño de la muestra, para : $f_i(x_i)$ $i = 1 \text{ to } 8$

Estamos interesados en la distribución de . $\text{min}(X_1, X_2, X_3, \dots)$

Cada vez que agregamos un término adicional, el pdf del último término marginal agregado se desplaza más y más a la derecha, de modo que el efecto de agregar más y más términos se vuelve no solo menos y menos relevante, sino que después de unos pocos términos , se vuelve casi insignificante, en la muestra mínima Esto significa, en efecto, que es probable que solo un número muy pequeño de términos realmente importe ... y agregar términos adicionales (o la presencia de un número infinito de términos) es en gran medida irrelevante para el problema mínimo de la muestra.

Prueba

Para probar esto, he calculado el pdf de a 1 término, 2 términos, 3 términos, 4 términos, 5 términos, 6 términos, 7 términos, 8 términos, a 9 términos y a 10 términos. Para hacer esto, he usado la función de mathStatica , instruyéndola aquí para calcular el pdf del mínimo de muestra (la estadística de orden ) en una muestra de tamaño , y donde el parámetro (en su lugar de ser reparado) es : $\text{min}(X_1, X_2, X_3, \dots)$ OrderStatNonIdentical $1^{\text{st}}$ $j$ $i$ $v_i$

Se vuelve un poco complicado a medida que aumenta el número de términos ... pero he mostrado el resultado para 1 término (primera fila), 2 términos (segunda fila), 3 términos (tercera fila) y 4 términos anteriores.

El siguiente diagrama compara el pdf del mínimo de la muestra con 1 término (azul), 2 términos (naranja), 3 términos y 10 términos (rojo). Observe cuán similares son los resultados con solo 3 términos frente a 10 términos:

El siguiente diagrama compara 5 términos (azul) y 10 términos (naranja): las gráficas son tan similares que se destruyen entre sí, y uno ni siquiera puede ver la diferencia:

En otras palabras, aumentar el número de términos de 5 a 10 casi no tiene un impacto visual perceptible en la distribución del mínimo de la muestra.

Aproximación semi-logística

Finalmente, una excelente aproximación simple del pdf de la muestra min es la distribución semi-logística con pdf:

g (x) = \frac{2 e^{- x}}{{(e^{- x} + 1)}^{2}} for x > 0

$g(x) = \frac{2 e^{-x}}{\left(e^{-x}+1\right)^2} \quad \text{ for } x>0$

El siguiente diagrama compara la solución exacta con 10 términos (que es indistinguible de 5 términos o 20 términos) y la aproximación semi-logística (discontinua):

El aumento a 20 términos no hace una diferencia perceptible.

lobos
fuente