Por favor explique la paradoja que espera

75

Hace unos años diseñé un detector de radiación que funciona midiendo el intervalo entre eventos en lugar de contarlos. Mi suposición era que, al medir muestras no contiguas, en promedio mediría la mitad del intervalo real. Sin embargo, cuando probé el circuito con una fuente calibrada, la lectura era un factor de dos demasiado alto, lo que significaba que había estado midiendo el intervalo completo.

En un viejo libro sobre probabilidad y estadística encontré una sección sobre algo llamado "La paradoja de la espera". Presentó un ejemplo en el que un autobús llega a la parada de autobús cada 15 minutos y un pasajero llega al azar, declaró que el pasajero esperaría en promedio los 15 minutos completos. Nunca he podido entender las matemáticas presentadas con el ejemplo y seguir buscando una explicación. Si alguien puede explicar por qué es para que el pasajero espere el intervalo completo, dormiré mejor.

Stephen Sackett
fuente
1
¿Cuál es el título y quién es el autor del libro? ¿Podría copiar el ejemplo palabra por palabra aquí?
Joel Reyes Noche
Esta no es mi especialidad, pero ¿es la paradoja mencionada por el OP lo mismo que la paradoja de la inspección ?
Joel Reyes Noche
1
Publicación
ddiez
1
Parece que mi suposición anterior tiene algo de apoyo. Un comentario a esta respuesta menciona la paradoja de la inspección.
Joel Reyes Noche
2
Creo que usar un autobús ya que la analogía es confusa, ya que los autobuses tienden a seguir los horarios. Piense en cambio en cuánto tiempo le tomará llegar a un taxi vacío cuando, en promedio, uno llega cada 15 minutos.
Harvey Motulsky

Respuestas:

48

Como señaló Glen_b, si los autobuses llegan cada minutos sin ninguna incertidumbre , sabemos que el tiempo de espera máximo posible es de 15 minutos. Si de nuestra parte llegamos "al azar", sentimos que "en promedio" esperaremos la mitad del tiempo de espera máximo posible . Y el tiempo de espera máximo posible aquí es igual a la longitud máxima posible entre dos llegadas consecutivas. Denote nuestro tiempo de espera W y la longitud máxima entre dos llegadas consecutivas de autobuses R , y argumentamos que1515WR

(1)mi(W)=12R=152=7.5

y estamos en lo correcto

Pero de repente se nos quita la certeza y se nos dice que minutos es ahora la duración promedio entre dos llegadas de autobuses. Y caemos en la "trampa del pensamiento intuitivo" y pensamos: "solo necesitamos reemplazar R con su valor esperado", y argumentamos15R

(2)mi(W)=12mi(R)=152=7.5INCORRECTO

Una primera indicación de que estamos equivocados, es que no es "longitud entre dos llegadas de autobús consecutivas", es " longitud máxima, etc.". En cualquier caso, tenemos que E ( R ) 15 .Rmi(R)15

¿Cómo llegamos a la ecuación ? Pensamos: "el tiempo de espera puede ser de 0 a 15 como máximo . Llego con la misma probabilidad en cualquier caso, así que" elijo "al azar y con la misma probabilidad todos los tiempos de espera posibles. Por lo tanto, la mitad de la longitud máxima entre dos llegadas consecutivas de autobús es mi tiempo de espera promedio ". Y estamos en lo cierto.(1)0 015

Pero al insertar por error el valor en la ecuación ( 2 ) , ya no refleja nuestro comportamiento. Con 15 en lugar de E ( R ) , la ecuación ( 2 ) dice "Elijo al azar y con la misma probabilidad todos los tiempos de espera posibles que sean menores o iguales a la longitud promedio entre dos llegadas consecutivas de autobuses ", y aquí es donde nuestro intuitivo el error radica en que nuestro comportamiento no ha cambiado; por lo tanto, al llegar aleatoriamente de manera uniforme, en realidad todavía "elegimos aleatoriamente y con igual probabilidad" todos los tiempos de espera posibles, pero "todos los tiempos de espera posibles" no son capturados por15(2)15mi(R)(2) - hemos olvidado la cola derecha de la distribución de longitudes entre dos llegadas consecutivas de autobuses. 15

Entonces, quizás deberíamos calcular el valor esperado de la longitud máxima entre dos llegadas consecutivas de autobuses, ¿es esta la solución correcta?

Sí, podría ser, pero : la "paradoja" específica va de la mano con una suposición estocástica específica: que las llegadas de autobuses están modeladas por el proceso de referencia de Poisson, lo que significa que, como consecuencia, suponemos que el período de tiempo entre dos llegadas de autobús consecutivas siguen una distribución exponencial. Denote esa longitud, y tenemos eso

F()=λmi-λ,λ=1/ /15,mi()=15

Esto es aproximado, por supuesto, ya que la distribución exponencial tiene un apoyo ilimitado desde la derecha, lo que significa que, estrictamente hablando, "todos los tiempos de espera posibles" incluyen, bajo este supuesto de modelado, magnitudes mayores y mayores hasta e "incluido" infinito, pero con una probabilidad desvaneciente .

Pero espera, la exponencial es sin memoria : no importa en qué momento en el tiempo que llegaremos, nos enfrentamos a la misma variable aleatoria , independientemente de lo que ha ido antes.

Dado este supuesto estocástico / distributivo, cualquier momento es parte de un "intervalo entre dos llegadas de autobuses consecutivas" cuya longitud se describe por la misma distribución de probabilidad con el valor esperado (no el valor máximo) : "Estoy aquí, estoy rodeado por un intervalo entre dos llegadas de autobuses. Parte de su longitud se encuentra en el pasado y otras en el futuro, pero no tengo forma de saber cuánto y cuánto, así que lo mejor que puedo hacer es preguntar ¿Cuál es su longitud esperada? ¿Cuál será mi tiempo de espera promedio? " - Y la respuesta es siempre " 15 ", por desgracia. 1515

Alecos Papadopoulos
fuente
+1 Muy bien. quizás debería leer f λ ( ) ? F()Fλ()
ameba dice Reinstate Monica
Gracias. En cuanto a la notación, ambos se usan para indicar cosas diferentes. Lo que escribí está en la línea de enfatizar cuya densidad variable aleatoria es, porque en las diversas transformaciones podemos terminar con algo así como . Lo que sugiere es enfatizar el aspecto parametrizado de la densidad. FX(y)
Alecos Papadopoulos
80

Si el autobús llega "cada 15 minutos" (es decir, en un horario), la espera promedio del pasajero (que llega al azar) es de hecho solo 7,5 minutos, porque se distribuirá uniformemente en ese intervalo de 15 minutos.

-

Si, por otro lado, el autobús llega al azar a una tasa promedio de 4 por hora (es decir, de acuerdo con un proceso de Poisson), entonces la espera promedio es mucho más larga; de hecho, puede resolverlo a través de la falta de propiedad de memoria. Tome la llegada del pasajero como el comienzo, y el tiempo para el próximo evento es exponencial con una media de 15 minutos.

Déjame tomar una analogía de tiempo discreto. Imagine que estoy tirando un dado con 15 caras, una de las cuales está etiquetada como "B" (para el autobús) y 14 etiquetada como "X" por la ausencia total de autobús en ese momento ( existen dados de 30 lados , por lo que podría etiquetar 2 de los caras de un dado de 30 lados "B"). Entonces, una vez por minuto, ruedo y veo si viene el autobús. El dado no tiene memoria; no sabe cuántos rollos ha sido desde la última "B". Ahora imagine que ocurre un evento desconectado: un perro ladra, llega un pasajero, escucho un trueno. A partir de ahora, ¿cuánto tiempo espero (cuántos rollos) hasta la próxima "B"?

Debido a la falta de memoria, en promedio, espero el mismo tiempo para la próxima "B" que el tiempo entre dos "B" consecutivas.

[Luego imagine que tengo un dado de 60 lados que lanzo cada quince segundos (de nuevo, con una cara "B"); Ahora imagine que tenía un dado de 1000 lados que lancé cada 0.9 segundos (con una cara "B"; o más realista, tres dados de 10 lados cada uno y llamo al resultado una "B" si los 3 aparecen "10" en al mismo tiempo) ... y así sucesivamente. En el límite, obtenemos el proceso de tiempo continuo de Poisson.]

tt

Como un veterano receptor de autobuses, en la práctica la realidad parece estar en algún lugar entre 'los autobuses llegan en un horario' y 'los autobuses llegan al azar'. Y a veces (en mal tráfico), espera una hora y luego 3 llegan de una vez (Zach identifica la razón de eso en los comentarios a continuación).

Glen_b
fuente
66
Creo que con los autobuses específicamente hay un proceso adicional en el que un autobús tardío se vuelve más tarde cuando los pasajeros se aferran a él, y el autobús vacío detrás de él finalmente se pone al día (pero permanece vacío). = D
Zach
44
@Zach, de hecho, es por eso que tienden a agruparse en carreras largas, especialmente en tráfico pesado. Donde vivo cuando el autobús corre tan tarde que ya es hora del próximo, a veces insertan un autobús adicional que está casi a tiempo a lo largo de la ruta (es decir, conducirá sin pasajeros hasta donde el autobús no estaría muy lejos) horario, a menudo llegar allí a través de una ruta más rápida) y comenzar a recoger pasajeros para quienes ahora el autobús llega un poco tarde. Mientras tanto, el último autobús ahora se convierte efectivamente en el próximo autobús en el horario, una vez que llega a donde entró el otro autobús.
Glen_b
@Glen_b Esa es una muy buena idea, ¡ja!
Zach
Es una estrategia útil contra el agrupamiento (al menos, mitiga los peores casos); No lo habría mencionado, excepto que se relaciona con el tipo de problemas de dependencia que los modelos más precisos de tiempo de espera del autobús pueden necesitar abordar.
Glen_b
10

Más información sobre los autobuses ... Perdón por entrar en la conversación tan tarde en la discusión, pero he estado mirando los procesos de Poisson últimamente ... Entonces, antes de que se me escape de la cabeza, aquí hay una representación gráfica de la paradoja de la inspección :

λθ=1/λ=15

Si estuviéramos en un centro de despacho y pudiéramos ver todos los autobuses en una pantalla, sería cierto que recoger aleatoriamente varios autobuses y promediar la distancia al autobús que sigue, produciría el tiempo promedio entre llegadas:

ingrese la descripción de la imagen aquí

Pero, si lo que hacemos es simplemente aparecer en la estación de autobuses (en lugar de seleccionar un autobús), estamos haciendo una sección de tiempo aleatoria, digamos, a lo largo de la línea de tiempo del horario del autobús en una mañana típica. El momento en que decidimos aparecer en la estación de autobuses puede muy bien distribuirse uniformemente a lo largo de la "flecha" del tiempo. Sin embargo, dado que hay espacios de tiempo más largos entre los autobuses que se extienden más lejos, es más probable que terminemos sobremuestreando a estos "rezagados":

ingrese la descripción de la imagen aquí

... y, por lo tanto, nuestro libro de registro de tiempo de espera no reflejará el tiempo entre llegadas. Esta es la paradoja de la inspección.

15θ=15

E[time waiting (future) + time to last bus departure (past)]=30


ingrese la descripción de la imagen aquí


¿Todavía no está claro? - Pruébalo con Legos .

Antoni Parellada
fuente
Excelentes diagramas.
Glen_b
2

Hay una explicación simple que resuelve las diferentes respuestas que se obtienen al calcular el tiempo de espera esperado para los autobuses que llegan según un Proceso de Poisson con un tiempo medio de llegada determinado (en este caso 15 minutos), cuyos tiempos de llegada son, por lo tanto, exponenciales con una media de 15 minutos .

Método 1 ) Debido a que el Proceso de Poisson (exponencial) no tiene memoria, el tiempo de espera esperado es de 15 minutos.

Método 2 ) Es igualmente probable que llegue en cualquier momento durante el período entre llegadas en el que llega. Por lo tanto, el tiempo de espera esperado es 1/2 de la duración esperada de este período entre llegadas. ESTO ES CORRECTO y no entra en conflicto con el método (1).

¿Cómo pueden ser correctos (1) y (2)? La respuesta es que la duración esperada del período entre llegadas para el momento en que llega no es de 15 minutos. En realidad son 30 minutos; y 1/2 de 30 minutos son 15 minutos, entonces (1) y (2) están de acuerdo.

¿Por qué el período entre llegadas para el momento en que llegas no es igual a 15 minutos? Es porque al "fijar" por primera vez una hora de llegada, el período entre llegadas en el que se encuentra es más probable que el promedio de ser un período entre llegadas prolongado. En el caso de un período entre llegadas exponencial, las matemáticas funcionan de manera que el período entre llegadas que contiene el tiempo en el que llega es exponencial con el doble del tiempo entre llegadas promedio para el Proceso de Poisson.

No es obvio que la distribución exacta para el tiempo entre llegadas que contiene el tiempo en el que llega sea exponencial con una media duplicada, pero es obvio, después de la explicación, por qué se incrementa. Como un ejemplo fácil de entender, digamos que los tiempos entre llegadas son 10 minutos con probabilidad 1/2 o 20 minutos con probabilidad 1/2. En este caso, los períodos entre llegadas de 20 minutos de duración tienen la misma probabilidad de ocurrir que los períodos entre llegadas de 10 minutos, pero cuando ocurren, duran el doble. Entonces, 2/3 de los puntos de tiempo durante el día serán en momentos en que el período entre llegadas es de 20 minutos. Dicho de otra manera, si primero elegimos un tiempo y luego queremos saber cuál es el tiempo entre llegadas que contiene ese tiempo, entonces (ignorando los efectos transitorios al comienzo del "día" ) la duración esperada de ese tiempo entre llegadas es 16 1/3. Pero si primero elegimos el tiempo entre llegadas y queremos saber cuál es su duración esperada, son 15 minutos.

Hay otras variantes de la paradoja de la renovación, el muestreo sesgado por longitud, etc., que equivalen prácticamente a lo mismo.

Ejemplo 1) Tienes un montón de bombillas, con vidas aleatorias, pero un promedio de 1000 horas. Cuando una bombilla falla, se reemplaza inmediatamente por otra bombilla. Si elige un momento para ir a una habitación que tiene la bombilla, la bombilla en funcionamiento terminará teniendo una vida media más larga que 1000 horas.

Ejemplo 2) Si vamos a un sitio de construcción en un momento dado, entonces el tiempo promedio hasta que un trabajador de la construcción que está trabajando allí en ese momento se cae del edificio (desde el momento en que comenzaron a trabajar) es mayor que el tiempo medio hasta que el trabajador se cae (de cuando comenzaron a trabajar) de todos los trabajadores que comienzan a trabajar. Por qué, porque los trabajadores con un tiempo medio corto hasta la caída son más propensos que el promedio a haberse caído (y no continuar trabajando), de modo que los trabajadores que trabajan tienen más tiempo que el promedio hasta que se caen.

Ejemplo 3) Elija un número modesto de personas al azar en una ciudad y si han asistido a los juegos locales (no todas las entradas agotadas) del equipo de béisbol de Grandes Ligas de la ciudad, averigüe cuántas personas asistieron a los juegos en los que participaron. Luego (bajo algunas suposiciones ligeramente idealizadas pero no demasiado irrazonables), la asistencia promedio para esos juegos será mayor que la asistencia promedio para todos los juegos en casa del equipo. ¿Por qué? Debido a que hay más personas que han asistido a juegos de alta asistencia que a juegos de baja asistencia, entonces es más probable que elija personas que hayan asistido a juegos de alta asistencia que a los de baja asistencia.

Mark L. Stone
fuente
0

La pregunta planteada fue "... un autobús llega a la parada de autobús cada 15 minutos y un pasajero llega al azar". Si el autobús llega cada 15 minutos, no es aleatorio; llega cada 15 minutos, por lo que la respuesta correcta es de 7,5 minutos. O la fuente fue citada incorrectamente o el escritor de la fuente fue descuidado.

Por otro lado, el detector de radiación suena como un problema diferente porque los eventos de radiación llegan al azar según alguna distribución, presumiblemente algo así como Poisson con un tiempo de espera promedio.

Emil Friedman
fuente