¿Cómo explicaría iid (independiente e idénticamente distribuido) a personas no técnicas?
random-variable
intuition
usuario333
fuente
fuente
Explicación no técnica:
La independencia es una noción muy general. Se dice que dos eventos son independientes si la ocurrencia de uno no le brinda información sobre si el otro evento ocurrió o no. En particular, la probabilidad de que adscribamos al segundo evento no se ve afectada por el conocimiento de que el primer evento ha ocurrido.
Ejemplo de eventos independientes, posiblemente distribuidos de manera idéntica
Considere lanzar dos monedas diferentes una tras otra. Suponiendo que su pulgar no se cansó excesivamente cuando lanzó la primera moneda, es razonable suponer que saber que el primer lanzamiento de la moneda resultó en Caras de ninguna manera influye en lo que usted cree que es la probabilidad de Caras en el segundo lanzamiento. Se dice que los dos eventos son eventos independientes .
Si sabemos, o insistimos obstinadamente, que las dos monedas tienen diferentes probabilidades de resultar en Caras, entonces los eventos no se distribuyen de manera idéntica.
fuente
Una variable aleatoria es una variable que contiene la probabilidad de todos los eventos posibles en un escenario. Por ejemplo, creemos una variable aleatoria que represente el número de caras en 100 lanzamientos de monedas. La variable aleatoria contendrá la probabilidad de obtener 1 cara, 2 cabezas, 3 cabezas ... hasta 100 cabezas. Llamemos a esta variable aleatoria X .
Si tiene dos variables aleatorias, entonces son IID (independientes idénticamente distribuidas) si:
Nota al margen: La independencia también significa que puede multiplicar las probabilidades. Digamos que la probabilidad de caras es p, entonces la probabilidad de obtener dos caras seguidas es p * p, o p ^ 2.
fuente
Con este ejemplo se puede mostrar que dos variables dependientes pueden tener la misma distribución:
Suponga dos experimentos sucesivos que involucran cada 100 lanzamientos de una moneda sesgada, donde el número total de Cabezas se modela como una variable aleatoria X1 para el primer experimento y X2 para el segundo experimento. X1 y X2 son variables aleatorias binomiales con parámetros 100 y p, donde p es el sesgo de la moneda.
Como tal, están distribuidos de manera idéntica. Sin embargo, no son independientes, ya que el valor de la primera es bastante informativo sobre el valor de la segunda. Es decir, si el resultado del primer experimento es 100 Caras, esto nos dice mucho sobre el sesgo de la moneda y, por lo tanto, nos da mucha información nueva sobre la distribución de X2.
Todavía X2 y X1 se distribuyen de manera idéntica, ya que se derivan de la misma moneda.
Lo que también es cierto es que si 2 variables aleatorias son dependientes, entonces el posterior de X2 dado X1 nunca será el mismo que el anterior de X2 y viceversa. Mientras que cuando X1 y X2 son independientes, sus posteriores son iguales a sus anteriores. Por lo tanto, cuando dos variables son dependientes, la observación de una de ellas da como resultado estimaciones revisadas con respecto a la distribución de la segunda. Aún así, ambos pueden ser de la misma distribución, es solo que aprendemos en el proceso más sobre la naturaleza de esta distribución. Entonces, volviendo a los experimentos de lanzamiento de monedas, inicialmente en ausencia de información, podemos suponer que X1 y X2 siguen una distribución binomial con los parámetros 100 y 0.5. Pero después de observar 100 cabezas seguidas, sin duda revisaremos nuestra estimación sobre el parámetro p para que sea bastante cercano a 1.
fuente
Una agregación de varios sorteos aleatorios de la misma distribución. Un ejemplo es sacar una canica de la bolsa 10,000 veces y contar las veces que sacas la canica roja.
fuente
Sin embargo, estar distribuido de manera idéntica no implica necesariamente independencia.
fuente