¿Por qué la distribución de rand () ^ 2 es diferente de la de rand () * rand ()?

14

En Libre Office Calc, la rand()función está disponible, que elige un valor aleatorio entre 0 y 1 de una distribución uniforme. Estoy un poco oxidado en mi probabilidad, así que cuando vi el siguiente comportamiento, me quedé perplejo:

A = Columna 200x1 de rand()^2

B = Columna 200x1 de rand()*rand()

mean(A) = 1/3

mean(B) = 1/4

¿Por qué es mean(A)! = 1/4?

Jefftopia
fuente
44
Porque la expectativa del cuadrado de una variable aleatoria no es igual al cuadrado de su expectativa.
Michael M
3
Si rand()funciona como otros operadores similares, entonces A es el mismo número aleatorio al cuadrado y B es dos números aleatorios, multiplicados.
Peter Flom - Restablece a Monica
Entiendo. Sin embargo, sería muy útil si pudiera ver las matemáticas explicadas o vinculadas a un recurso que haga esto.
Jefftopia el
44
Simplificar la situación podría ayudarlo a ver el punto. Supongamos que Rand()se reemplaza por Int(2*Rand()): esto toma los valores y 1 con probabilidades iguales. Hay dos posibilidades para su cuadrado y cuatro posibilidades para el producto de dos valores (independientes): ¿qué sucede cuando calcula sus expectativas? 01
whuber

Respuestas:

24

Puede ser útil pensar en rectángulos. Imagine que tiene la oportunidad de obtener tierras gratis. El tamaño de la tierra estará determinado por (a) una realización de la variable aleatoria o (b) dos realizaciones de la misma variable aleatoria. En el primer caso (a), el área será un cuadrado con la longitud del lado igual al valor muestreado. En el segundo caso (b), los dos valores muestreados representarán el ancho y la longitud de un rectángulo. ¿Qué alternativa eliges?

Sea una realización de una variable aleatoria positiva.U

a) El valor esperado de una realización determina el área del cuadrado que es igual a U 2 . En promedio, el tamaño del área será E [ U 2 ]UU2

E[U2]

b) Si hay dos realizaciones independientes y U 2 , el área será U 1U 2 . En promedio, el tamaño es igual a E [ U 1U 2 ] = E 2 [ U ] ya que ambas realizaciones son de la misma distribución e independientes.U1U2U1U2

mi[U1U2]=mi2[U]

Cuando calculamos la diferencia entre el tamaño de las áreas a) yb), obtenemos

mi[U2]-mi2[U]

El término anterior es idéntico a que es inherentemente mayor o igual a 0 .Vunr[U]0 0

Esto vale para el caso general.

En su ejemplo, tomó muestras de la distribución uniforme . Por lo tanto,U(0 0,1)

E2

mi[U]=12
Var
mi2[U]=14 4
Vunr[U]=112

Con obtenemos E [mi[U2]=Vunr[U]+mi2[U]

mi[U2]=112+14 4=13

Estos valores se obtuvieron analíticamente, pero coinciden con los que obtuvo con el generador de números aleatorios.

Sven Hohenstein
fuente
unsiun2+unsi+si23
Ese es un uso inteligente de la varianza. Y aquí estaba a punto de sacar las matemáticas directamente.
Affine
Esto tiene sentido para mí. Todo depende de que la varianza sea no negativa. También tengo curiosidad por saber cómo John obtuvo su respuesta.
Jefftopia
Básicamente solo seguí lo que hizo Sven, pero los reemplazó con las fórmulas para una distribución uniforme más general.
John
mi[U2]-mi[U2]mi[U2]-mi2[U]
9

Sin sugerir que falta algo de la excelente respuesta de Sven, pero quería presentar una opinión relativamente elemental sobre la pregunta.

Considere trazar los dos componentes de cada producto para ver que la distribución conjunta es muy diferente.

trama de u1 vs u2 y u1 vs u1

Tenga en cuenta que el producto solo tiende a ser grande (cerca de 1) cuando ambos componentes son grandes, lo que ocurre mucho más fácilmente cuando los dos componentes están perfectamente correlacionados en lugar de ser independientes.

1-ϵϵϵ/ /2U2U1×U2ϵ2/ /2

Toda una diferencia!

Puede ser útil dibujar contornos de isoproductos en gráficos como los de arriba, es decir, curvas donde xy = constante para valores como 0.5, 0.6, 0.7, 0.8, 0.9. A medida que avanza a valores cada vez mayores, la proporción de puntos arriba y a la derecha del contorno disminuye mucho más rápidamente para el caso independiente.

Glen_b -Reinstate a Monica
fuente