Deje que un palo de longitud 1 se rompa en fragmentos uniformemente al azar. ¿Cuál es la distribución de la longitud del fragmento más largo?
Más formalmente, sea ser IID , y sea las estadísticas de pedido asociadas, es decir , simplemente ordenamos la muestra de tal manera que . Deje .
Estoy interesado en la distribución de . Momentos, resultados asintóticos o aproximaciones para también son interesantes.
Respuestas:
Con la información dada por @Glen_b pude encontrar la respuesta. Usando las mismas anotaciones que la pregunta
donde si y contrario. También doy la expectativa y la convergencia asintótica a la distribución de Gumbel ( NB : no Beta)a > 0 0a+=a a>0 0
El material de las pruebas se toma de varias publicaciones vinculadas en las referencias. Son algo largos, pero directos.
1. Prueba de la distribución exacta.
Deje ser variables aleatorias uniformes IID en el intervalo . Al ordenarlos, obtenemos las estadísticas de orden indicadas . Los uniformes se definen como , con y . Los espacios ordenados son las estadísticas ordenadas correspondientes . La variable de interés es .( 0 , 1 ) k ( U ( 1 ) , … , U ( k ) ) Δ i = U ( i ) - U ( i - 1 ) U ( 0 ) = 0 U ( k + 1 ) = 1 Δ ( 1 ) ≤(U1,…,Uk) (0,1) k ( U( 1 ), ... , U( k )) Δyo= U( i )- U( i - 1 ) U( 0 )= 0 U( k + 1 )= 1 Δ ( k + 1 )Δ( 1 )≤ … ≤ Δ( k + 1 ) Δ( k + 1 )
Para fijo , definimos la variable indicadora . Por simetría, el vector aleatorio es intercambiable, por lo que la distribución conjunta de un subconjunto de tamaño es la misma que la distribución conjunta de la primera . Al expandir el producto, obtenemos así1 i = 1 { Δ i > x } ( 1 1 , … , 1 k + 1 ) j jx ∈ ( 0 , 1 ) 1yo= 1{ Δyo> x } ( 11, ... , 1k + 1) j j
Ahora demostraremos que , que establecerá la distribución dada anteriormente. Probamos esto para , ya que el caso general se demuestra de manera similar. j = 2mi( ∏ji = 11yo) =(1-jx )k+ j=2
Si , los puntos de interrupción están en el intervalo . Condicionalmente en este evento, los puntos de ruptura siguen siendo intercambiables, por lo que la probabilidad de que la distancia entre el segundo y el primer punto de ruptura sea mayor que es la misma que la probabilidad de que la distancia entre el primer punto de ruptura y la barrera izquierda (en la posición ) es mayor que . Asi quek ( x , 1 ) x x xΔ1>x k (x,1) x x x
2. Expectativa
Para distribuciones con soporte finito, tenemos
Integrando la distribución de , obtenemosΔ(k+1)
La última igualdad es una representación clásica de números armónicos , que demostramos a continuación.Hi=1+12+…+1i
Con el cambio de la variable y expandiendo el producto, obtenemosu=1−x
3. Construcción alternativa de separaciones uniformes.
Para obtener la distribución asintótica del fragmento más grande, necesitaremos exhibir una construcción clásica de espacios uniformes como variables exponenciales divididas por su suma. La densidad de probabilidad de las estadísticas de orden asociadas es(U(1),…,U(k))
Si denotamos los espaciamientos uniformes , con , obtenemos U ( 0 ) = 0Δi=U(i)−U(i−1) U(0)=0
Al definir , obtenemos asíU(k+1)=1
Ahora, sea ser IID variables aleatorias exponenciales con media 1, y sea . Con un simple cambio de variable, podemos ver queS = X 1 + … + X k + 1(X1,…,Xk+1) S=X1+…+Xk+1
Defina , de modo que mediante un cambio de variable obtengamosYi=Xi/S
Integrando esta densidad con respecto a , obtenemos asís
Entonces la distribución conjunta de espaciamientos uniformes en el intervalo es la misma que la distribución conjunta de variables aleatorias exponenciales divididas por su suma. Llegamos a la siguiente equivalencia de distribuciónk+1 (0,1) k+1
4. Distribución asintótica.
Usando la equivalencia anterior, obtenemos
donde . Esta variable desaparece en probabilidad porque y . Asintóticamente, la distribución es la misma que la de . Debido a que los son IID, tenemosTk+1=X1+…+Xk+1k+1−1 E(Tk+1)=0 Var(log(k+1)Tk+1)=(log( k + 1 ) )2k + 1↓ 0 X( k + 1 )- registro( k + 1 ) Xyo
5. Resumen gráfico
La siguiente gráfica muestra la distribución del fragmento más grande para diferentes valores de . Para , también he superpuesto la distribución asintótica de Gumbel (línea delgada). El Gumbel es una muy mala aproximación para valores pequeños de así que los omito para no sobrecargar la imagen. La aproximación de Gumbel es buena desde .k k = 10 , 20 , 50 k k ≈ 50
6. Referencias
Las pruebas anteriores se toman de las referencias 2 y 3. La literatura citada contiene muchos más resultados, como la distribución de los espacios ordenados de cualquier rango, su distribución límite y algunas construcciones alternativas de los espacios uniformes ordenados. Las referencias clave no son fácilmente accesibles, por lo que también proporciono enlaces al texto completo.
fuente
Esta no es una respuesta completa, pero hice algunas simulaciones rápidas, y esto es lo que obtuve:
Esto parece notablemente beta-ish, y esto tiene un poco de sentido, ya que las estadísticas de orden de las distribuciones uniformes de iid son beta wiki .
Esto podría dar algún punto de partida para derivar el pdf resultante.
Actualizaré si llego a una solución final cerrada.
¡Aclamaciones!
fuente
Produje la respuesta para una conferencia en Siena (Italia) en 2005. El documento (2006) se presenta en mi sitio web aquí (pdf) . Las distribuciones exactas de todos los espacios (de menor a mayor) se encuentran en las páginas 75 y 76.
Espero dar una presentación sobre este tema en la Conferencia RSS en Manchester (Inglaterra) en septiembre de 2016.
fuente