Distribución del fragmento más grande de un palo roto (separaciones)

21

Deje que un palo de longitud 1 se rompa en fragmentos uniformemente al azar. ¿Cuál es la distribución de la longitud del fragmento más largo?k+1

Más formalmente, sea ser IID , y sea las estadísticas de pedido asociadas, es decir , simplemente ordenamos la muestra de tal manera que . Deje .(U1,...Uk)U(0 0,1)(U(1),...,U(k))U(1)U(2),,U(k)Zk=max(U(1),U(2)U(1),,U(k)U(k1),1U(k))

Estoy interesado en la distribución de Zk . Momentos, resultados asintóticos o aproximaciones para k también son interesantes.

gui11aume
fuente
99
Este es un problema bien estudiado; ver R. Pyke (1965), "Spacings", JRSS (B) 27 : 3, pp. 395-449. Intentaré volver para agregar alguna información más adelante a menos que alguien me gane. También hay un artículo de 1972 del mismo autor (" Spacings revisited ") pero creo que lo que buscas es casi todo al principio. Hay algunas asintóticas en Devroye (1981) , "Leyes del logaritmo iterado para estadísticas de orden de espaciamiento uniforme" Ann. Probab , 9 : 5, 860-867.
Glen_b -Reinstate Monica
44
Esos también deberían dar algunos buenos términos de búsqueda para encontrar trabajo posterior si lo necesita.
Glen_b -Reinstate Monica
3
Esto es asombroso La primera referencia es difícil de encontrar. Para aquellos interesados, lo puse en The Grand Locus .
gui11aume
Corrija el error de imprenta: lugar de . Y(k)U(k)
Viktor
Gracias @Viktor! Para cosas tan pequeñas, no dude en hacer la edición usted mismo (creo que será revisado por otros usuarios para su aprobación).
gui11aume

Respuestas:

18

Con la información dada por @Glen_b pude encontrar la respuesta. Usando las mismas anotaciones que la pregunta

P(Zkx)=j=0k+1(k+1j)(1)j(1jx)+k,

donde si y contrario. También doy la expectativa y la convergencia asintótica a la distribución de Gumbel ( NB : no Beta)a > 0 0a+=aa>00

E(Zk)=1k+1i=1k+11ilog(k+1)k+1,P(Zkx)exp(e(k+1)x+log(k+1)).

El material de las pruebas se toma de varias publicaciones vinculadas en las referencias. Son algo largos, pero directos.

1. Prueba de la distribución exacta.

Deje ser variables aleatorias uniformes IID en el intervalo . Al ordenarlos, obtenemos las estadísticas de orden indicadas . Los uniformes se definen como , con y . Los espacios ordenados son las estadísticas ordenadas correspondientes . La variable de interés es .( 0 , 1 ) k ( U ( 1 ) , , U ( k ) ) Δ i = U ( i ) - U ( i - 1 ) U ( 0 ) = 0 U ( k + 1 ) = 1 Δ ( 1 )(U1,,Uk)(0,1)k(U(1),...,U(k))Δyo=U(yo)-U(yo-1)U(0 0)=0 0U(k+1)=1 Δ ( k + 1 )Δ(1)...Δ(k+1)Δ(k+1)

Para fijo , definimos la variable indicadora . Por simetría, el vector aleatorio es intercambiable, por lo que la distribución conjunta de un subconjunto de tamaño es la misma que la distribución conjunta de la primera . Al expandir el producto, obtenemos así1 i = 1 { Δ i > x } ( 1 1 , , 1 k + 1 ) j jX(0 0,1)1yo=1{Δyo>X}(11,...,1k+1)jj

PAGS(Δ(k+1)X)=mi(yo=1k+1(1-1yo))=1+j=1k+1(k+1j)(-1)jmi(yo=1j1yo).

Ahora demostraremos que , que establecerá la distribución dada anteriormente. Probamos esto para , ya que el caso general se demuestra de manera similar. j = 2mi(yo=1j1yo)=(1-jX)+kj=2

E(i=121i)=P(Δ1>xΔ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).

Si , los puntos de interrupción están en el intervalo . Condicionalmente en este evento, los puntos de ruptura siguen siendo intercambiables, por lo que la probabilidad de que la distancia entre el segundo y el primer punto de ruptura sea mayor que es la misma que la probabilidad de que la distancia entre el primer punto de ruptura y la barrera izquierda (en la posición ) es mayor que . Asi quek ( x , 1 ) x x xΔ1>xk(x,1)xxx

P(Δ2>x|Δ1>x)=P(all points are in (2x,1)|all points are in (x,1)),soP(Δ2>xΔ1>x)=P(all points are in (2x,1))=(12x)+k.

2. Expectativa

Para distribuciones con soporte finito, tenemos

E(X)=P(X>x)dx=1P(Xx)dx.

Integrando la distribución de , obtenemosΔ(k+1)

E(Δ(k+1))=1k+1j=1k+1(k+1j)(1)j+1j=1k+1j=1k+11j.

La última igualdad es una representación clásica de números armónicos , que demostramos a continuación.Hi=1+12++1i

Hk+1=011+x++xkdx=011xk+11xdx.

Con el cambio de la variable y expandiendo el producto, obtenemosu=1x

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. Construcción alternativa de separaciones uniformes.

Para obtener la distribución asintótica del fragmento más grande, necesitaremos exhibir una construcción clásica de espacios uniformes como variables exponenciales divididas por su suma. La densidad de probabilidad de las estadísticas de orden asociadas es(U(1),,U(k))

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

Si denotamos los espaciamientos uniformes , con , obtenemos U ( 0 ) = 0Δi=U(i)U(i1)U(0)=0

fΔ1,Δk(δ1,,δk)=k!,0δi++δk1.

Al definir , obtenemos asíU(k+1)=1

fΔ1,Δk+1(δ1,,δk+1)=k!,δ1++δk=1.

Ahora, sea ser IID variables aleatorias exponenciales con media 1, y sea . Con un simple cambio de variable, podemos ver queS = X 1 + + X k + 1(X1,,Xk+1)S=X1++Xk+1

fX1,Xk,S(x1,,xk,s)=es.

Defina , de modo que mediante un cambio de variable obtengamosYi=Xi/S

fY1,Yk,S(y1,,yk,s)=skes.

Integrando esta densidad con respecto a , obtenemos asís

fY1,Yk,(y1,,yk)=0skesds=k!,0yi++yk1,and thusfY1,Yk+1,(y1,,yk+1)=k!,y1++yk+1=1.

Entonces la distribución conjunta de espaciamientos uniformes en el intervalo es la misma que la distribución conjunta de variables aleatorias exponenciales divididas por su suma. Llegamos a la siguiente equivalencia de distribuciónk+1(0,1)k+1

Δ(k+1)X(k+1)X1++Xk+1.

4. Distribución asintótica.

Usando la equivalencia anterior, obtenemos

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

donde . Esta variable desaparece en probabilidad porque y . Asintóticamente, la distribución es la misma que la de . Debido a que los son IID, tenemosTk+1=X1++Xk+1k+11E(Tk+1)=0Vunar(Iniciar sesión(k+1)Tk+1)=(Iniciar sesión(k+1))2k+10 0X(k+1)-Iniciar sesión(k+1)Xyo

PAGS(X(k+1)-Iniciar sesión(k+1)X)=PAGS(X1X+Iniciar sesión(k+1))k+1=(1-mi-X-Iniciar sesión(k+1))k+1=(1-mi-Xk+1)k+1exp{-mi-X}.

5. Resumen gráfico

La siguiente gráfica muestra la distribución del fragmento más grande para diferentes valores de . Para , también he superpuesto la distribución asintótica de Gumbel (línea delgada). El Gumbel es una muy mala aproximación para valores pequeños de así que los omito para no sobrecargar la imagen. La aproximación de Gumbel es buena desde .kk=10,20,50kk50

Distribución del fragmento más grande de un palo roto.

6. Referencias

Las pruebas anteriores se toman de las referencias 2 y 3. La literatura citada contiene muchos más resultados, como la distribución de los espacios ordenados de cualquier rango, su distribución límite y algunas construcciones alternativas de los espacios uniformes ordenados. Las referencias clave no son fácilmente accesibles, por lo que también proporciono enlaces al texto completo.

  1. Bairamov y col. (2010) Límite de resultados para espaciamiento uniforme ordenado , Stat papers, 51: 1, pp 227-240
  2. Holst (1980) En las longitudes de las piezas de un palo roto al azar , J. Appl. Prob., 17, págs. 623-634
  3. Pyke (1965) Spacings , JRSS (B) 27: 3, págs. 395-449
  4. Renyi (1953) Sobre la teoría de las estadísticas del orden , Acta math Hung, 4, pp 191-231
gui11aume
fuente
Brillante. Por cierto, ¿hay alguna asintótica conocida para ? mi(Zk2)
Amir Sagiv
@AmirSagiv esta es una buena pregunta. Eché un vistazo rápido a las referencias y no pude encontrarlo. Tampoco pude adaptar la prueba anterior. Esto me hizo darme cuenta de que no sé cuál es la distribución de un cuadrado de un Gumbel. Quizás un buen lugar para comenzar?
gui11aume
1
$ gui11aume Mira aquí: mathoverflow.net/a/293381/42864
Amir Sagiv
1
@AmirSagiv Esta es una muy buena publicación. Por alguna razón, mal su pregunta y pensé que estaba interesado en la distribución asintótica de (a pesar de que su comentario fue muy claro), por lo que mi comentario anterior no es tan relevante. Zk2
gui11aume
3

Esta no es una respuesta completa, pero hice algunas simulaciones rápidas, y esto es lo que obtuve: Histograma del fragmento más largo.

Esto parece notablemente beta-ish, y esto tiene un poco de sentido, ya que las estadísticas de orden de las distribuciones uniformes de iid son beta wiki .

Esto podría dar algún punto de partida para derivar el pdf resultante.

Actualizaré si llego a una solución final cerrada.

¡Aclamaciones!

Lima
fuente
Solo una cosa más, la forma del histograma para aumentar k no cambia considerablemente, aparte de "aplastarse" cerca de 0.
Lima
1
Gracias por sus pensamientos @Lima (y bienvenidos a Cross Validated). Creo que tu respuesta puede mejorarse. Primero, me abstendría de hacer declaraciones sin pruebas. Si esto es incorrecto, puede poner a las personas que ven este hilo en el camino equivocado. En segundo lugar, documentaría lo que hiciste. Sin el valor de que usó ni el código, la figura no ayuda a nadie. Finalmente, copiaría y editaría la respuesta y eliminaría todo lo que no responda directamente a la pregunta. k
gui11aume
1
Gracias por las sugerencias Son válidos más allá del intercambio de pila, y recordaré usarlos.
Lima
1

Produje la respuesta para una conferencia en Siena (Italia) en 2005. El documento (2006) se presenta en mi sitio web aquí (pdf) . Las distribuciones exactas de todos los espacios (de menor a mayor) se encuentran en las páginas 75 y 76.

Espero dar una presentación sobre este tema en la Conferencia RSS en Manchester (Inglaterra) en septiembre de 2016.

CJStephens
fuente
2
Bienvenido al sitio. Estamos tratando de construir un repositorio permanente de información estadística de alta calidad en forma de preguntas y respuestas. Por lo tanto, desconfiamos de las respuestas de solo enlace, debido a linkrot. ¿Puede publicar una cita completa y un resumen de la información en el enlace, en caso de que falle? Además, no firmes tus publicaciones aquí. Cada publicación tiene un enlace a su página de usuario donde puede publicar esa información.
gung - Restablecer Monica