Rompecabezas: ¿Cuál es la longitud esperada de una secuencia iid que aumenta monotónicamente cuando se extrae de una distribución uniforme [0,1]?

Esta es una pregunta de entrevista para un puesto de analista cuantitativo, que se informa aquí . Supongamos que estamos dibujando a partir de una distribución uniforme y los sorteos son iid, ¿cuál es la longitud esperada de una distribución monotónicamente creciente? Es decir, dejamos de dibujar si el dibujo actual es menor o igual que el dibujo anterior. $[0,1]$

He recibido los primeros:

Pr (longitud = 1) = \int_{0 0}^{1} \int_{0 0}^{X_{1}} re X_{2} re X_{1} = 1 / / 2

$\Pr(\text{length} = 1) = \int_0^1 \int_0^{x_1} \mathrm{d}x_2\, \mathrm{d}x_1 = 1/2$

Pr (longitud = 2) = \int_{0 0}^{1} \int_{X_{1}}^{1} \int_{0 0}^{X_{2}} re X_{3} re X_{2} re X_{1} = 1 / / 3

$\Pr(\text{length} = 2) = \int_0^1 \int_{x_1}^1 \int_0^{x_2} \mathrm{d}x_3 \, \mathrm{d}x_2 \, \mathrm{d}x_1 = 1/3$

Pr (longitud = 3) = \int_{0 0}^{1} \int_{X_{1}}^{1} \int_{X_{2}}^{1} \int_{0 0}^{X_{3}} re X_{4 4} re X_{3} re X_{2} re X_{1} = 1 / / 8

$\Pr(\text{length} = 3) = \int_0^1 \int_{x_1}^1 \int_{x_2}^1 \int_0^{x_3} \mathrm{d}x_4\, \mathrm{d}x_3\, \mathrm{d}x_2\, \mathrm{d}x_1 = 1/8$

pero encuentro que calcular estas integrales anidadas es cada vez más difícil y no obtengo el "truco" para generalizar a $\Pr(\text{length} = n)$ . Sé que la respuesta final está estructurada

E (length) = \sum_{n = 1}^{\infty} n Pr (length = n)

$\mathbb E(\text{length}) = \sum_{n=1}^{\infty}n\Pr(\text{length} = n)$

¿Alguna idea sobre cómo responder a esta pregunta?

probability random-variable expected-value uniform iid amazónico
fuente

Respuestas:

Aquí hay algunos consejos generales para resolver esta pregunta:

Tiene una secuencia de variables aleatorias IID continuas, lo que significa que son intercambiables . ¿Qué implica esto acerca de la probabilidad de obtener un orden particular para los primeros valores? En base a esto, ¿cuál es la probabilidad de obtener un orden creciente para los primeros valores? Es posible resolver esto sin integrar la distribución de las variables aleatorias subyacentes. Si lo hace bien, podrá obtener una respuesta sin suponer una distribución uniforme, es decir, obtendrá una respuesta que se aplica a cualquier secuencia intercambiable de variables aleatorias continuas. $n$ $n$

Aquí está la solución completa ( no mire si se supone que debe resolver esto usted mismo ):

Deje que sea su secuencia de variables aleatorias continuas independientes, y deje sea el número de elementos crecientes al comienzo de la secuencia. Debido a que estas son variables aleatorias intercambiables continuas, casi seguramente son desiguales entre sí, y cualquier orden es igualmente probable, por lo que tenemos: (Tenga en cuenta que este resultado es válido para cualquier secuencia IID de variables aleatorias continuas; no tienen que tener una distribución uniforme). Por lo tanto, la variable aleatoria tiene una función de masa de probabilidad $U_1, U_2, U_3, \cdots \sim \text{IID Continuous Dist}$ $N \equiv \max \{ n \in \mathbb{N} | U_1 < U_2 < \cdots < U_n \}$
$P (N ⩾ n) = P (U_{1} < U_{2} < \dots < U_{n}) = \frac{1}{n!} .$ $\mathbb{P}(N \geqslant n) = \mathbb{P}(U_1 < U_2 < \cdots < U_n) = \frac{1}{n!}.$ $N$ $p_{N} (n) = P (N = n) = \frac{1}{n!} - \frac{1}{(n + 1)!} = \frac{n}{(n + 1)!} .$ $p_N(n) = \mathbb{P}(N=n) = \frac{1}{n!} - \frac{1}{(n+1)!} = \frac{n}{(n+1)!}.$ Notará que este resultado concuerda con los valores que ha calculado utilizando la integración sobre los valores subyacentes. (Esta parte no es necesaria para la solución; se incluye para completarla). Usando una regla bien conocida para el valor esperado de una variable aleatoria no negativa , tenemos: Tenga en cuenta nuevamente que no hay nada en nuestro trabajo que utilice la distribución uniforme subyacente. Por lo tanto, este es un resultado general que se aplica a cualquier secuencia intercambiable de variables aleatorias continuas. $E (N) = \sum_{n = 1}^{\infty} P (N ⩾ n) = \sum_{n = 1}^{\infty} \frac{1}{n!} = e - 1 = 1.718282.$ $\mathbb{E}(N) = \sum_{n=1}^\infty \mathbb{P}(N \geqslant n) = \sum_{n=1}^\infty \frac{1}{n!} = e - 1 = 1.718282.$

Algunas ideas adicionales:

Del trabajo anterior vemos que este resultado de distribución y el valor esperado resultante no dependen de la distribución subyacente, siempre que sea una distribución continua. Esto realmente no es sorprendente una vez que consideramos el hecho de que cada variable aleatoria escalar continua puede obtenerse a través de una transformación monotónica de una variable aleatoria uniforme (siendo la transformación su función cuantil). Dado que las transformaciones monotónicas preservan el orden de clasificación, observar las probabilidades de ordenamiento de variables aleatorias continuas IID arbitrarias es lo mismo que observar las probabilidades de ordenamiento de variables aleatorias uniformes IID .

Reinstala a Monica
fuente

¡Bien hecho! (+1)

jbowman

@Ben te sigo hasta la última ecuación ... Pensé que el valor esperado debería ser, en lugar de ... ¿podría explicar esta parte más?

E (N) = \sum_{n = 1}^{\infty} P (N = n) * n = \sum_{n = 1}^{\infty} n^{2} / (n + 1)!

$E(N)=∑_{n=1}^∞P(N=n)*n=∑_{n=1}^∞ n^2/(n+1)!$

E (N) = \sum_{n = 1}^{\infty} P (N ⩾ n)

$E(N)=∑_{n=1}^∞P(N⩾n)$

Amazonas

Esta es una regla bien conocida para el valor esperado de una variable aleatoria no negativa . Usando una técnica que implica cambiar el orden de las sumas, tiene: Por lo que debe encontrar que .

E (N) = \sum_{n = 1}^{\infty} n P (N = n) = \sum_{n = 1}^{\infty} \sum_{k = 1}^{n} P (N = n) = \sum_{n = 1}^{\infty} \sum_{k = n}^{\infty} P (N = k) = \sum_{n = 1}^{\infty} P (N ⩾ n) .

$\mathbb{E}(N) = \sum_{n=1}^\infty n \mathbb{P}(N=n) = \sum_{n=1}^\infty \sum_{k=1}^n \mathbb{P}(N = n) = \sum_{n=1}^\infty \sum_{k=n}^\infty \mathbb{P}(N =k) = \sum_{n=1}^\infty \mathbb{P}(N \geqslant n).$

\sum_{n} \frac{1}{n!} = \sum_{n} \frac{n^{2}}{(n + 1)!}

$\sum_n \tfrac{1}{n!} = \sum_n \tfrac{n^2}{(n+1)!}$

Vuelva a instalar a Monica el

¿Puede explicar por qué ?

P (N ⩾ n) = P (U_{1} < U_{2} < \dots < U_{n})

${P}(N \geqslant n) = \mathbb{P}(U_1 < U_2 < \cdots < U_n)$

badmax

@badmax: La variable aleatoria es el número de elementos crecientes de al comienzo de la secuencia (consulte su definición). Por lo tanto, si eso significa que hay al menos elementos crecientes al comienzo de la secuencia. Esto significa que los primeros elementos deben estar en orden creciente, que es .

N

$N$

U

$U$

N ⩾ n

$N \geqslant n$

n

$n$

n

$n$

U_{1} < U_{2} < \dots < U_{n}

$U_1 < U_2 < \cdots < U_n$

Restablece a Mónica el

Otro método de resolución que le brinda la solución para un caso más general.

Supongamos que es la longitud esperada de una secuencia monótona , de modo que . El valor que queremos calcular es . Y sabemos que . Condicionando al siguiente valor, $F(x)$ $\{x_1, x_2, ...\}$ $x\leq x_1\leq x_2\leq\cdots$ $F(0)$ $F(1)=0$

F (x) = \int_{0}^{x} π (y) \cdot 0 d y + \int_{x}^{1} π (y) (1 + F (y)) d y = \int_{x}^{1} 1 + F (y) d y

$F(x) = \int_0^x \pi(y)\cdot 0 dy + \int_x^1\pi(y)(1+F(y))dy= \int_x^1 1+F(y) dy$

donde es la densidad U [0,1]. Asi que $\pi(y)=1$

F^{'} (x) = - (1 + F (x))

$F'(x)=-(1+F(x))$

Resolviendo con la condición límite , obtenemos . Por lo tanto, . $F(1)=0$ $F(x) = e^{(1-x)}-1$ $F(0)=e-1$

jf328
fuente

Esto es muy inteligente. Solo para explicarlo un poco: sus observaciones son que 1) si

es la longitud de la secuencia creciente inicial más larga menos uno, entonces es suficiente para determinar

y establecer

y 2)

es cero si

L

$L$

E (L | X_{0} = x) =: F (x)

$E(L|X_0=x)=:F(x)$

x = 0

$x=0$

E (L | X_{0} = x, X_{1} = y)

$E(L|X_0=x,X_1=y)$

y < x

$y<x$

contrario. Dado que

1 + E (L | X_{0} = y)

$1+E(L|X_0=y)$

obtenemos

E (L | X_{0} = x) = E (E (L | X_{0} = x, X_{1})) = \int_{R} f_{X} (y) E (L | X_{0} = x, X_{1} = y) d y = \int_{x}^{1} f_{X} (y) (1 + E (L | X_{0} = y)) d y = \int_{x}^{1} f_{X} (y) (1 + F (y)) d y

$E(L|X_0=x)=E(E(L|X_0=x,X_1)) = \int_\mathbb{R} f_X(y) E(L|X_0=x, X_1=y) dy = \int_x^1 f_X(y)(1+E(L|X_0=y))dy= \int_x^1 f_X(y)(1+F(y))dy$

, que en el caso uniforme se puede resolver directamente.

F^{'} (x) = - f_{X} (x) (1 + F (x))

$F'(x)=-f_X(x)(1+F(x))$

Matthew Towers

+1 Muy inteligente de hecho. Pero dado que la respuesta final no depende de la distribución (como se analiza en la otra respuesta), este cálculo tampoco debería depender de alguna manera de

. ¿Hay alguna forma de verlo? CC a @m_t_.

π (y)

$\pi(y)$

ameba dice Reinstate Monica

F (0)

$F(0)$

X

$X$

F

$F$

F = C e^{- \int π} - 1

$F=Ce^{-\int \pi}-1$

C = e

$C=e$

e e^{- x} - 1

$e e^{-x} -1$

c e^{1 - x} - 1

$ce^{1-x}-1$

c e^{- x} - 1

$ce^{-x}-1$

Otro método de resolución es calcular la integral directamente.

$\geq n$ $f^n(0)$ $f^n(x) = \int_{x}^{1}\int_{x_1}^{1}\int_{x_2}^{1}...\int_{x_{n-2}}^{1}\int_{x_{n-1}}^{1}dx_ndx_{n-1}...dx_2dx_1$

$f^n(0)$

$f^n(x)$ $f^n(x) = \sum_{t=0}^n \dfrac{(-x)^t}{t!(n-t)!}$

$n=1$ $f^1(x) = \sum_{t=0}^1 \dfrac{(-x)^t}{t!(n-t)!}=1-x=\int_{x}^{1}dx_1$

$n=k$ $f^n(x) = \sum_{t=0}^k \dfrac{(-x)^t}{t!(k-t)!}\text{ , for }k \geq 1$

$n = k+1$

$\ \ \ \ \ f^{n}(x) = f^{k+1}(x) = \int_{x}^{1}f^{k}(x^*)dx^*$

$=\int_{x}^{1}\sum_{t=0}^{k} \dfrac{(-x^*)^t}{t!(k-t)!}dx^*$

$=\sum_{t=0}^{k} \dfrac{-(-x^*)^{t+1}}{t!(k-t)!\times(t+1)}\Biggr|_{x}^{1}\\=\sum_{t=0}^{k} \dfrac{-(-x^*)^{t+1}}{(t+1)!(k-t)!}\Biggr|_{x}^{1}$

$=\sum_{t=1}^{k+1} \dfrac{-(-x^*)^{t}}{t!(k-t+1)!}\Biggr|_{x}^{1}$

$=\sum_{t=1}^{k+1} \dfrac{(-1)^{t+1}}{t!(k-t+1)!}+\sum_{t=1}^{k+1} \dfrac{(-x)^{t}}{t!(k-t+1)!}$

$=\sum_{t=1}^{k+1} \dfrac{(-1)^{t+1}C_t^{k+1}}{(k+1)!}+\sum_{t=1}^{k+1} \dfrac{(-x)^{t}}{t!(k-t+1)!}$

$=\dfrac{1}{(k+1)!}+\sum_{t=0}^{k+1} \dfrac{(-1)^{t+1}C_t^{k+1}}{(k+1)!}+\sum_{t=1}^{k+1} \dfrac{(-x)^{t}}{t!(k-t+1)!}$

$=\dfrac{1}{(k+1)!}-\dfrac{(1-1)^{k+1}}{(k+1)!}+\sum_{t=1}^{k+1} \dfrac{(-x)^{t}}{t!(k-t+1)!}$

$=\sum_{t=0}^{k+1} \dfrac{(-x)^{t}}{t!(k-t+1)!}$

By Mathematical Induction, the assumption holds.

Thus, we get that $f^n(0)=\dfrac{1}{n!}$

So, $E(length)=\sum_{n=1}^{\infty} Pr(length\geq n)=\sum_{n=1}^{\infty} \dfrac{1}{n!}=e-1$

劉家維
fuente