Hace unos años diseñé un detector de radiación que funciona midiendo el intervalo entre eventos en lugar de contarlos. Mi suposición era que, al medir muestras no contiguas, en promedio mediría la mitad del intervalo real. Sin embargo, cuando probé el circuito con una fuente calibrada, la lectura era un factor de dos demasiado alto, lo que significaba que había estado midiendo el intervalo completo.
En un viejo libro sobre probabilidad y estadística encontré una sección sobre algo llamado "La paradoja de la espera". Presentó un ejemplo en el que un autobús llega a la parada de autobús cada 15 minutos y un pasajero llega al azar, declaró que el pasajero esperaría en promedio los 15 minutos completos. Nunca he podido entender las matemáticas presentadas con el ejemplo y seguir buscando una explicación. Si alguien puede explicar por qué es para que el pasajero espere el intervalo completo, dormiré mejor.
fuente
Respuestas:
Como señaló Glen_b, si los autobuses llegan cada minutos sin ninguna incertidumbre , sabemos que el tiempo de espera máximo posible es de 15 minutos. Si de nuestra parte llegamos "al azar", sentimos que "en promedio" esperaremos la mitad del tiempo de espera máximo posible . Y el tiempo de espera máximo posible aquí es igual a la longitud máxima posible entre dos llegadas consecutivas. Denote nuestro tiempo de espera W y la longitud máxima entre dos llegadas consecutivas de autobuses R , y argumentamos que15 15 W R
y estamos en lo correcto
Pero de repente se nos quita la certeza y se nos dice que minutos es ahora la duración promedio entre dos llegadas de autobuses. Y caemos en la "trampa del pensamiento intuitivo" y pensamos: "solo necesitamos reemplazar R con su valor esperado", y argumentamos15 R
Una primera indicación de que estamos equivocados, es que no es "longitud entre dos llegadas de autobús consecutivas", es " longitud máxima, etc.". En cualquier caso, tenemos que E ( R ) ≠ 15 .R mi( R ) ≠ 15
¿Cómo llegamos a la ecuación ? Pensamos: "el tiempo de espera puede ser de 0 a 15 como máximo . Llego con la misma probabilidad en cualquier caso, así que" elijo "al azar y con la misma probabilidad todos los tiempos de espera posibles. Por lo tanto, la mitad de la longitud máxima entre dos llegadas consecutivas de autobús es mi tiempo de espera promedio ". Y estamos en lo cierto.( 1 ) 0 0 15
Pero al insertar por error el valor en la ecuación ( 2 ) , ya no refleja nuestro comportamiento. Con 15 en lugar de E ( R ) , la ecuación ( 2 ) dice "Elijo al azar y con la misma probabilidad todos los tiempos de espera posibles que sean menores o iguales a la longitud promedio entre dos llegadas consecutivas de autobuses ", y aquí es donde nuestro intuitivo el error radica en que nuestro comportamiento no ha cambiado; por lo tanto, al llegar aleatoriamente de manera uniforme, en realidad todavía "elegimos aleatoriamente y con igual probabilidad" todos los tiempos de espera posibles, pero "todos los tiempos de espera posibles" no son capturados por15 ( 2 ) 15 mi( R ) ( 2 ) - hemos olvidado la cola derecha de la distribución de longitudes entre dos llegadas consecutivas de autobuses. 15
Entonces, quizás deberíamos calcular el valor esperado de la longitud máxima entre dos llegadas consecutivas de autobuses, ¿es esta la solución correcta?
Sí, podría ser, pero : la "paradoja" específica va de la mano con una suposición estocástica específica: que las llegadas de autobuses están modeladas por el proceso de referencia de Poisson, lo que significa que, como consecuencia, suponemos que el período de tiempo entre dos llegadas de autobús consecutivas siguen una distribución exponencial. Denote esa longitud, y tenemos esoℓ
Esto es aproximado, por supuesto, ya que la distribución exponencial tiene un apoyo ilimitado desde la derecha, lo que significa que, estrictamente hablando, "todos los tiempos de espera posibles" incluyen, bajo este supuesto de modelado, magnitudes mayores y mayores hasta e "incluido" infinito, pero con una probabilidad desvaneciente .
Pero espera, la exponencial es sin memoria : no importa en qué momento en el tiempo que llegaremos, nos enfrentamos a la misma variable aleatoria , independientemente de lo que ha ido antes.
Dado este supuesto estocástico / distributivo, cualquier momento es parte de un "intervalo entre dos llegadas de autobuses consecutivas" cuya longitud se describe por la misma distribución de probabilidad con el valor esperado (no el valor máximo) : "Estoy aquí, estoy rodeado por un intervalo entre dos llegadas de autobuses. Parte de su longitud se encuentra en el pasado y otras en el futuro, pero no tengo forma de saber cuánto y cuánto, así que lo mejor que puedo hacer es preguntar ¿Cuál es su longitud esperada? ¿Cuál será mi tiempo de espera promedio? " - Y la respuesta es siempre " 15 ", por desgracia.15 15
fuente
Si el autobús llega "cada 15 minutos" (es decir, en un horario), la espera promedio del pasajero (que llega al azar) es de hecho solo 7,5 minutos, porque se distribuirá uniformemente en ese intervalo de 15 minutos.
-
Si, por otro lado, el autobús llega al azar a una tasa promedio de 4 por hora (es decir, de acuerdo con un proceso de Poisson), entonces la espera promedio es mucho más larga; de hecho, puede resolverlo a través de la falta de propiedad de memoria. Tome la llegada del pasajero como el comienzo, y el tiempo para el próximo evento es exponencial con una media de 15 minutos.
Déjame tomar una analogía de tiempo discreto. Imagine que estoy tirando un dado con 15 caras, una de las cuales está etiquetada como "B" (para el autobús) y 14 etiquetada como "X" por la ausencia total de autobús en ese momento ( existen dados de 30 lados , por lo que podría etiquetar 2 de los caras de un dado de 30 lados "B"). Entonces, una vez por minuto, ruedo y veo si viene el autobús. El dado no tiene memoria; no sabe cuántos rollos ha sido desde la última "B". Ahora imagine que ocurre un evento desconectado: un perro ladra, llega un pasajero, escucho un trueno. A partir de ahora, ¿cuánto tiempo espero (cuántos rollos) hasta la próxima "B"?
Debido a la falta de memoria, en promedio, espero el mismo tiempo para la próxima "B" que el tiempo entre dos "B" consecutivas.
[Luego imagine que tengo un dado de 60 lados que lanzo cada quince segundos (de nuevo, con una cara "B"); Ahora imagine que tenía un dado de 1000 lados que lancé cada 0.9 segundos (con una cara "B"; o más realista, tres dados de 10 lados cada uno y llamo al resultado una "B" si los 3 aparecen "10" en al mismo tiempo) ... y así sucesivamente. En el límite, obtenemos el proceso de tiempo continuo de Poisson.]
Como un veterano receptor de autobuses, en la práctica la realidad parece estar en algún lugar entre 'los autobuses llegan en un horario' y 'los autobuses llegan al azar'. Y a veces (en mal tráfico), espera una hora y luego 3 llegan de una vez (Zach identifica la razón de eso en los comentarios a continuación).
fuente
Más información sobre los autobuses ... Perdón por entrar en la conversación tan tarde en la discusión, pero he estado mirando los procesos de Poisson últimamente ... Entonces, antes de que se me escape de la cabeza, aquí hay una representación gráfica de la paradoja de la inspección :
Si estuviéramos en un centro de despacho y pudiéramos ver todos los autobuses en una pantalla, sería cierto que recoger aleatoriamente varios autobuses y promediar la distancia al autobús que sigue, produciría el tiempo promedio entre llegadas:
Pero, si lo que hacemos es simplemente aparecer en la estación de autobuses (en lugar de seleccionar un autobús), estamos haciendo una sección de tiempo aleatoria, digamos, a lo largo de la línea de tiempo del horario del autobús en una mañana típica. El momento en que decidimos aparecer en la estación de autobuses puede muy bien distribuirse uniformemente a lo largo de la "flecha" del tiempo. Sin embargo, dado que hay espacios de tiempo más largos entre los autobuses que se extienden más lejos, es más probable que terminemos sobremuestreando a estos "rezagados":
... y, por lo tanto, nuestro libro de registro de tiempo de espera no reflejará el tiempo entre llegadas. Esta es la paradoja de la inspección.
¿Todavía no está claro? - Pruébalo con Legos .
fuente
Hay una explicación simple que resuelve las diferentes respuestas que se obtienen al calcular el tiempo de espera esperado para los autobuses que llegan según un Proceso de Poisson con un tiempo medio de llegada determinado (en este caso 15 minutos), cuyos tiempos de llegada son, por lo tanto, exponenciales con una media de 15 minutos .
Método 1 ) Debido a que el Proceso de Poisson (exponencial) no tiene memoria, el tiempo de espera esperado es de 15 minutos.
Método 2 ) Es igualmente probable que llegue en cualquier momento durante el período entre llegadas en el que llega. Por lo tanto, el tiempo de espera esperado es 1/2 de la duración esperada de este período entre llegadas. ESTO ES CORRECTO y no entra en conflicto con el método (1).
¿Cómo pueden ser correctos (1) y (2)? La respuesta es que la duración esperada del período entre llegadas para el momento en que llega no es de 15 minutos. En realidad son 30 minutos; y 1/2 de 30 minutos son 15 minutos, entonces (1) y (2) están de acuerdo.
¿Por qué el período entre llegadas para el momento en que llegas no es igual a 15 minutos? Es porque al "fijar" por primera vez una hora de llegada, el período entre llegadas en el que se encuentra es más probable que el promedio de ser un período entre llegadas prolongado. En el caso de un período entre llegadas exponencial, las matemáticas funcionan de manera que el período entre llegadas que contiene el tiempo en el que llega es exponencial con el doble del tiempo entre llegadas promedio para el Proceso de Poisson.
No es obvio que la distribución exacta para el tiempo entre llegadas que contiene el tiempo en el que llega sea exponencial con una media duplicada, pero es obvio, después de la explicación, por qué se incrementa. Como un ejemplo fácil de entender, digamos que los tiempos entre llegadas son 10 minutos con probabilidad 1/2 o 20 minutos con probabilidad 1/2. En este caso, los períodos entre llegadas de 20 minutos de duración tienen la misma probabilidad de ocurrir que los períodos entre llegadas de 10 minutos, pero cuando ocurren, duran el doble. Entonces, 2/3 de los puntos de tiempo durante el día serán en momentos en que el período entre llegadas es de 20 minutos. Dicho de otra manera, si primero elegimos un tiempo y luego queremos saber cuál es el tiempo entre llegadas que contiene ese tiempo, entonces (ignorando los efectos transitorios al comienzo del "día" ) la duración esperada de ese tiempo entre llegadas es 16 1/3. Pero si primero elegimos el tiempo entre llegadas y queremos saber cuál es su duración esperada, son 15 minutos.
Hay otras variantes de la paradoja de la renovación, el muestreo sesgado por longitud, etc., que equivalen prácticamente a lo mismo.
Ejemplo 1) Tienes un montón de bombillas, con vidas aleatorias, pero un promedio de 1000 horas. Cuando una bombilla falla, se reemplaza inmediatamente por otra bombilla. Si elige un momento para ir a una habitación que tiene la bombilla, la bombilla en funcionamiento terminará teniendo una vida media más larga que 1000 horas.
Ejemplo 2) Si vamos a un sitio de construcción en un momento dado, entonces el tiempo promedio hasta que un trabajador de la construcción que está trabajando allí en ese momento se cae del edificio (desde el momento en que comenzaron a trabajar) es mayor que el tiempo medio hasta que el trabajador se cae (de cuando comenzaron a trabajar) de todos los trabajadores que comienzan a trabajar. Por qué, porque los trabajadores con un tiempo medio corto hasta la caída son más propensos que el promedio a haberse caído (y no continuar trabajando), de modo que los trabajadores que trabajan tienen más tiempo que el promedio hasta que se caen.
Ejemplo 3) Elija un número modesto de personas al azar en una ciudad y si han asistido a los juegos locales (no todas las entradas agotadas) del equipo de béisbol de Grandes Ligas de la ciudad, averigüe cuántas personas asistieron a los juegos en los que participaron. Luego (bajo algunas suposiciones ligeramente idealizadas pero no demasiado irrazonables), la asistencia promedio para esos juegos será mayor que la asistencia promedio para todos los juegos en casa del equipo. ¿Por qué? Debido a que hay más personas que han asistido a juegos de alta asistencia que a juegos de baja asistencia, entonces es más probable que elija personas que hayan asistido a juegos de alta asistencia que a los de baja asistencia.
fuente
La pregunta planteada fue "... un autobús llega a la parada de autobús cada 15 minutos y un pasajero llega al azar". Si el autobús llega cada 15 minutos, no es aleatorio; llega cada 15 minutos, por lo que la respuesta correcta es de 7,5 minutos. O la fuente fue citada incorrectamente o el escritor de la fuente fue descuidado.
Por otro lado, el detector de radiación suena como un problema diferente porque los eventos de radiación llegan al azar según alguna distribución, presumiblemente algo así como Poisson con un tiempo de espera promedio.
fuente