Informalmente, una distribución de probabilidad define la frecuencia relativa de resultados de una variable aleatoria: el valor esperado puede considerarse como un promedio ponderado de esos resultados (ponderado por la frecuencia relativa). Del mismo modo, el valor esperado puede considerarse como la media aritmética de un conjunto de números generados en proporción exacta a su probabilidad de ocurrir (en el caso de una variable aleatoria continua, esto no es exactamente cierto ya que los valores específicos tienen probabilidad ).0
La conexión entre el valor esperado y la media aritmética es más clara con una variable aleatoria discreta, donde el valor esperado es
E(X)=∑SxP(X=x)
donde es el espacio muestral. Como ejemplo, suponga que tiene una variable aleatoria discreta tal que:SX
X=⎧⎩⎨123with probability 1/8with probability 3/8with probability 1/2
Es decir, la función de masa de probabilidad es , y . Usando la fórmula anterior, el valor esperado esP(X=1)=1/8P(X=2)=3/8P(X=3)=1/2
E(X)=1⋅(1/8)+2⋅(3/8)+3⋅(1/2)=2.375
Ahora considere los números generados con frecuencias exactamente proporcionales a la función de masa de probabilidad, por ejemplo, el conjunto de números - dos s, seis sy ocho s. Ahora tome la media aritmética de estos números:{1,1,2,2,2,2,2,2,3,3,3,3,3,3,3,3}123
1+1+2+2+2+2+2+2+3+3+3+3+3+3+3+316=2.375
y puede ver que es exactamente igual al valor esperado.
La expectativa es el valor promedio o la media de una variable aleatoria, no una distribución de probabilidad. Como tal, es para variables aleatorias discretas el promedio ponderado de los valores que la variable aleatoria adquiere donde la ponderación es de acuerdo con la frecuencia relativa de ocurrencia de esos valores individuales. Para una variable aleatoria absolutamente continua, es la integral de los valores x multiplicada por la densidad de probabilidad. Los datos observados se pueden ver como los valores de una colección de variables aleatorias independientes distribuidas idénticamente. La media muestral (o expectativa muestral) se define como la expectativa de los datos con respecto a la distribución empírica de los datos observados. Esto lo convierte simplemente en el promedio aritmético de los datos.
fuente
Prestemos mucha atención a las definiciones:
La media se define como la suma de una colección de números dividida por la cantidad de números en la colección. El cálculo sería "para i en 1 a n, (suma de x sub i) dividido por n".
El valor esperado (EV) es el valor promedio a largo plazo de las repeticiones del experimento que representa. El cálculo sería "para i en 1 a n, suma del evento x sub i multiplicado por su probabilidad (y la suma de todos los p sub i debe = 1)".
En el caso de un dado justo, es fácil ver que la media y el EV son iguales. Media - (1 + 2 + 3 + 4 + 5 + 6) / 6 - 3.5 y EV sería:
prob xp * x
0.167 1 0.17
0.167 2 0.33
0.167 3 0.50
0.167 4 0.67
0.167 5 0.83
0.167 6 1.00
EV = suma (p * x) = 3.50
Pero, ¿y si el dado no fuera "justo"? Una manera fácil de hacer un dado injusto sería perforar un agujero en la esquina en la intersección de las caras 4, 5 y 6. Además, ahora digamos que la probabilidad de sacar un 4, 5 o 6 en nuestro nuevo y mejorado dado torcido ahora es .2 y la probabilidad de sacar un 1, 2 o 3 es ahora .133. Es el mismo dado con 6 caras, un número en cada cara y la media de este dado sigue siendo 3.5. Sin embargo, después de lanzar este dado muchas veces, nuestro EV ahora es 3.8 porque las probabilidades para los eventos ya no son las mismas para todos los eventos.
prob xp * x
0.133 1 0.13
0.133 2 0.27
0.133 3 0.40
0.200 4 0.80
0.200 5 1.00
0.200 6 1.20
EV = suma (p * x) = 3.80
Nuevamente, tengamos cuidado y volvamos a la definición antes de concluir que una cosa siempre será "igual" que otra. Eche un vistazo a cómo se configura un dado normal y taladre un agujero en las otras 7 esquinas y vea cómo cambian los EV: diviértase.
Bob_T
fuente
La única diferencia entre "media" y "valor esperado" es que la media se usa principalmente para la distribución de frecuencias y la expectativa se usa para la distribución de probabilidad. En la distribución de frecuencias, el espacio muestral consta de variables y sus frecuencias de ocurrencia. En la distribución de probabilidad, el espacio muestral consta de variables aleatorias y sus probabilidades. Ahora sabemos que la probabilidad total de todas las variables en el espacio muestral debe ser = 1. Aquí en mentiras la diferencia básica. El término denominador para expectativa es siempre = 1. (es decir, Suma f (xi) = 1) Sin embargo, no existen tales restricciones en la suma de la frecuencia (que es básicamente el número total de entradas).
fuente