¿Qué tan extraño es un grupo de accidentes de avión?

15

Pregunta original (25/7/14): ¿Tiene sentido esta cita de los medios de comunicación o hay una mejor manera estadística de ver la avalancha de accidentes aéreos recientes?

Sin embargo, Barnett también llama la atención sobre la teoría de la distribución de Poisson, lo que implica que los intervalos cortos entre choques son en realidad más probables que los largos.

"Suponga que hay un promedio de un accidente fatal por año, lo que significa que la probabilidad de un accidente en un día determinado es de uno en 365", dice Barnett. "Si hay un bloqueo el 1 de agosto, la probabilidad de que el próximo choque ocurra un día después, el 2 de agosto, es 1/365. Pero la posibilidad de que el próximo choque sea el 3 de agosto es (364/365) x (1/365) , porque el próximo bloqueo se produce el 3 de agosto solo si no hay bloqueo el 2 de agosto ".

"Parece contradictorio, pero la conclusión se sigue implacablemente de las leyes de probabilidad", dice Barnett.

Fuente: http://www.bbc.com/news/magazine-28481060

Aclaración (27/07/14): Lo que es contra intuitivo (para mí) es decir que los eventos raros tienden a ocurrir cerca en el tiempo. Intuitivamente, pensaría que los eventos raros no ocurrirían en el tiempo cercano. ¿Alguien puede señalarme una distribución teórica o empírica esperada del tiempo entre eventos bajo los supuestos de una distribución de Poisson? (Es decir, un histograma donde el eje y es la frecuencia o probabilidad y el eje x es el tiempo entre 2 eventos consecutivos agrupados en días, semanas, meses o años, o similares). Gracias.

Aclaración (28/7/14): el titular implica que es más probable que haya grupos de accidentes que accidentes espaciados ampliamente. Permite operacionalizar eso. Digamos que un grupo son 3 accidentes aéreos, y un período corto de tiempo es de 3 meses y un período largo de tiempo es de 3 años. Parece ilógico pensar que existe una mayor probabilidad de que ocurran 3 accidentes dentro de un período de 3 meses que dentro de un período de 3 años. Incluso si tomamos el primer accidente como un hecho, es ilógico pensar que ocurrirán 2 accidentes más en los próximos 3 meses en comparación con los próximos 3 años. Si eso es cierto, entonces el titular de los medios de comunicación es engañoso e incorrecto. ¿Me estoy perdiendo de algo?

Joel W.
fuente
1
Re la aclaración: puede resultarle útil distinguir entre probabilidad , probabilidad por unidad de tiempo y expectativa . Aunque los procesos que describen eventos raros, prácticamente por el mismo significado de "raro", tienen un tiempo esperado largo entre eventos, eso no es inconsistente con la probabilidad por unidad de tiempo de ser mayor desde el principio. Sin embargo, la probabilidad de que el evento ocurra a continuación dentro de poco tiempo será muy pequeña.
whuber
2
Además, acabo de darme cuenta de este artículo de Wikipedia: puede que te guste. Ah, y acabo de encontrar este pdf , también: menciona específicamente el "agrupamiento" de los accidentes de aviación (y describe el problema mucho mejor de lo que lo he hecho hasta ahora ...).
Steve S
1
@Glen_b: La falla en el artículo del periódico (implícito en el título del artículo, que es el título de mi publicación) es que el artículo sugiere que hay una mayor probabilidad de que ocurra un número determinado (es decir, un grupo) de accidentes en un período de tiempo corto que durante un período de tiempo más largo. Eso está mal.
Joel W.
1
@JoelW .: En todo caso, sería el periodista el que la fastidió ... De todos modos, ¿está todo aclarado o aún le quedan reservas?
Steve S
1
Supongo que fue el estadístico quien engañó al periodista. Dudo que el periodista se haya equivocado solo (porque es muy contra-intuitivo).
Joel W.

Respuestas:

3

Resumen: La primera oración en el párrafo citado de la BBC es descuidada y engañosa.

A pesar de que las respuestas y comentarios previos ya proporcionaron una excelente discusión, creo que la pregunta principal no ha sido respondida satisfactoriamente.

Así que supongamos que la probabilidad de un accidente aéreo en un día determinado es y que los accidentes son independientes el uno del otro. Supongamos además que un avión se estrelló el 1 de enero. ¿Cuándo se estrellaría el próximo avión?p=1/365

Bueno, hagamos una simulación simple: para cada día durante los próximos tres años, decidiré al azar si otro avión se estrelló con probabilidad y anotaré el día del próximo accidente; Repetiré este procedimientop100000 veces. Aquí está el histograma resultante:

Distribución de aplastamientos planos, un modelo

De hecho, la distribución de probabilidad simplemente viene dada por , donde tPr(t)=(1p)tpt es el número de días. Tracé esta distribución teórica como una línea roja, y se puede ver que se ajusta bien al histograma de Monte Carlo. Observación: si el tiempo se discretizara en contenedores cada vez más pequeños, estas distribuciones convergerían en una exponencial; pero realmente no importa para esta discusión.

Como muchas personas ya han comentado aquí, es una curva decreciente . Esto significa que la probabilidad de que el próximo avión se estrelle al día siguiente, el 2 de enero, es mayor que la probabilidad de que el próximo avión se estrelle en cualquier otro día, por ejemplo, el 2 de enero del próximo año (la diferencia es casi tres veces mayor: y 0.10 % ).0.27%0.10%

Sin embargo , si pregunta cuál es la probabilidad de que el próximo avión se estrelle en los próximos tres días, la respuesta es , pero si pregunta cuál es la probabilidad de que se estrelle después de tres días, pero en los próximos tres años, entonces La respuesta es 94 % . Entonces, obviamente, es más probable que se bloquee en los próximos tres años (pero después de los primeros tres días) que en los próximos tres días. La confusión surge porque cuando dices "eventos agrupados" te refieres a una porción inicial muy pequeña de la distribución, pero cuando dices eventos "muy espaciados" te refieres a una gran porción de ella.0.8%94% Es por eso que incluso con una distribución de probabilidad monotónicamente decreciente, seguramente es posible que los "grupos" (por ejemplo, dos accidentes aéreos en tres días) sean muy improbables.

Aquí hay otro histograma para entender realmente este punto. Es simplemente una suma del histograma anterior durante varios períodos de tiempo que no se cruzan:

Histograma de frecuencia de aplastamiento de plano

ameba dice Reinstate Monica
fuente
¿Estás diciendo que el profesor del MIT está equivocado?
Steve S
1
No, la cita de Barnett en el artículo de la BBC es completamente correcta. Pero su interpretación del reportero de la BBC es descuidada en el mejor de los casos: "Barnett también llama la atención sobre la teoría de la distribución de Poisson, lo que implica que los intervalos cortos entre choques son en realidad más probables que los largos" . La interpretación más natural de esta oración es totalmente errónea (y supongo que Barnett no quiso decir eso). Tal vez debería ser más explícito sobre eso en mi respuesta. ¿Hay alguna parte sustancial de mi respuesta con la que no está de acuerdo? Espero que no, ya que estoy totalmente de acuerdo con el tuyo.
ameba dice Reinstate Monica
13

Lo que dice el periodista es que la ocurrencia aleatoria de un accidente aéreo puede modelarse como un proceso de Poisson, una situación en la que la probabilidad de que ocurra un evento durante un intervalo (pequeño) es proporcional a la duración de dicho intervalo y donde cada ocurrencia en Independiente de todos los demás.

¿Es este un modelo razonable para el escenario descrito?

Probablemente.

Claro, estos eventos podrían no ser 100% independientes, ya que otros pilotos probablemente alteren su comportamiento (aunque sea muy levemente) después de un choque. [No lo sé, tal vez algunos pilotos entrenan un poco más en el simulador o algo así]. Sin embargo, la asunción de la independencia sigue siendo completamente razonable.

¿Qué pasa con los grupos de accidentes de avión?

Si. Dado un proceso de Poisson (o incluso algún otro proceso aleatorio), que se esperar ver algunos grupos de ocurrencias.

De hecho, como lo describe el Oxford Dictionary of Statistics en su entrada para el Proceso de Poisson (que es una "descripción matemática de la aleatoriedad"):

[R]andomness usually gives rise to apparent clustering, despite the natural
expectation that randomness would lead to regularity.

Por ejemplo, echa un vistazo a este sencillo código R :

set.seed(123)
x <- runif(500)
y <- runif(500)

plot(x, y, pch=20, col='blue', main="A Random Distribution of Points")

que produce:
¿Nota el agrupamiento?

Aunque sabemos que esta es una gráfica de puntos aleatorios, parece que hay algunos bits no aleatorios, específicamente, en algunas partes del gráfico hay grupos de puntos, mientras que otras partes están completamente abiertas. Es el mismo tipo de comportamiento que el artículo está tratando de describir (solo con datos de series de tiempo y no datos espaciales ).


ACTUALIZAR:

@JoelW .: Entonces, por ejemplo, digamos que la probabilidad de que un avión se estrelle mañana (o cualquier día) es " p " (y, digamos que " p " es algo así como 1 en cien).

La razón por la cual es más probable que ocurra el próximo accidente de avión mañana de lo que es más probable que ocurra exactamente en un año (es decir, el 26 de julio de 2015 ) es porque la probabilidad de que el próximo accidente sea exactamente en un año es igual a:

= Prob(crash tomorrow) * Prob(365 days with *no* crashes)

¿Tener sentido?

En última instancia, creo que la razón de que estas cosas son contra-intuitivo se debe a que por lo general cuando pensamos en una frase como: "The odds of a plane crash in one month compared with the odds of one happening tomorrow". Naturalmente, no consideramos de inmediato el período de 24 horas que comienza exactamente en un mes. En cambio, nosotros (o al menos yo lo hago) tendemos a pensar en ello de manera más flexible . Por lo tanto más como: a month ± a week. Eso y el hecho de que nos olvidamos de tener en cuenta las probabilidades de que no se produzca un bloqueo en el ínterin ... (Pero, de nuevo, tal vez solo soy yo ...).

¡Uf!


Recursos adicionales:

  • Artículo de Wikipedia sobre la ilusión de agrupamiento
  • Un pdf que menciona específicamente el "agrupamiento" de accidentes aéreos (en la página 8) y describe brevemente las matemáticas de un proceso de Poisson .
Steve S
fuente
1
@Joel W .: En realidad, debería agregar más a esta respuesta - dame un par de minutos para editar ...
Steve S
77
El argumento para retrasar el viaje es el mismo que aparece en el viejo chiste sobre cómo la TSA encontró a un estadístico con una bomba a bordo de un avión. Cuando se le preguntó a explicar por sí misma, el estadístico dijo "Bueno, las probabilidades de que una persona que tiene una bomba son suficientes aún no pequeña pequeña para una mayor comodidad, pero las probabilidades de dos personas que tienen una bomba son infinitesimales. Por lo tanto, cuando me traen una bomba, hay casi no hay posibilidad de que haya dos bombas y estaremos perfectamente a salvo ".
whuber
1
Tu broma está en punto, @whuber, pero parece haber algún tipo de desconexión lógica entre decir que "los intervalos cortos entre choques son en realidad más probables que los largos" y decir que la probabilidad de un choque mañana es independiente de si es un choque ocurrió hoy Supongo que la probabilidad puede ser contra intuitiva.
Joel W.
1
Lo que es contrario a la intuición (para mí) es decir que los eventos raros tienden a ocurrir cerca en el tiempo. Intuitivamente, pensaría que los eventos raros no ocurrirían en el tiempo cercano. ¿Soy el único con esa visión intuitiva?
Joel W.
1
@ Steve S: Gracias por el enlace. ¿Cómo sería la distribución exponencial para el valor asumido en el artículo de noticias (1/365)? En cualquier caso, tal vez la Distribución exponencial no aborda el título del artículo, lo que implica una comparación de la probabilidad de que ocurra un número determinado de eventos en un período de tiempo corto con la probabilidad de que ese número de eventos ocurra en un período de tiempo largo .
Joel W.
4

Si el número de accidentes de avión está distribuido por Poisson (como parece estar afirmando), el tiempo entre accidentes tiene una distribución exponencial. El pdf de la distribución exponencial es una función monótona decreciente del tiempo. Por lo tanto, los bloqueos anteriores son más probables que los bloqueos posteriores.

Sid
fuente
"los intervalos cortos entre accidentes son en realidad más probables que los largos" ¿En qué se diferencia esto de decir que si ha habido un accidente aéreo todos deberíamos retrasar nuestro próximo viaje (por razones estadísticas)?
Joel W.
2
Joel, esa cita no tiene sentido hasta que su autor cuantifique lo que se entiende por "corto" y "largo". En su ejemplo de un evento con una tasa esperada de uno por año, la posibilidad de una recurrencia durante el próximo mes seguirá siendo mucho menor que la posibilidad de que el próximo accidente ocurra más de un año después. Lo que podría haber querido decir es que la probabilidad por unidad de tiempo es mayor a corto plazo que a largo plazo. Para comparar las probabilidades reales, debe multiplicar la probabilidad por unidad de tiempo por la duración (técnicamente, debe integrarla durante la duración).
whuber
@whuber: El titular habla de la probabilidad de un grupo de accidentes aéreos. Hasta el momento, nada de lo dicho en stackexchange me ha convencido de que un grupo de accidentes de aviación es más común o probable que los accidentes de aviación ampliamente separados. Entonces, me parece que la cita de los medios de comunicación es francamente engañosa (tal vez porque los intervalos de tiempo no están identificados, como escribió). ¿Qué piensas?
Joel W.
No sé a qué te refieres con "accidentes aéreos muy espaciados" ni, de hecho, estoy completamente seguro de lo que entiendes que es un "grupo". Supongamos que, para concretar la situación, ocurre una serie de eventos raros en los años 0, 10, 11, 12 y 22 (contando desde una fecha inicial). ¿Exactamente cuántos eventos "ampliamente espaciados" han ocurrido? ¿Cuántos "grupos" han ocurrido? Puedo encontrar respuestas defendibles a la primera pregunta que van desde cero hasta diez y las respuestas a la segunda pregunta podrían ser cero o una.
whuber
1
@whuber: El titular implica que es más probable que haya grupos de accidentes que accidentes espaciados ampliamente. Permite operacionalizar eso. Digamos que un grupo son 3 accidentes aéreos, y un período corto de tiempo es de 3 meses y un período largo de tiempo es de 3 años. Parece ilógico pensar que existe una mayor probabilidad de que ocurran 3 accidentes dentro de un período de 3 meses que dentro de un período de 3 años. Incluso si tomamos el primer accidente como un hecho, es ilógico pensar que ocurrirán 2 accidentes más en los próximos 3 meses en comparación con los próximos 3 años.
Joel W.
0

Las otras respuestas ya han tratado sobre cuán independiente se agrupan los eventos . (Leer el Caos de Gleick, hace tantos años, me abrió los ojos a esta idea).

Pero, de hecho, existe una fuerte evidencia de que los accidentes aéreos no son eventos independientes. La Influencia de Cialdini tiene un muy buen capítulo sobre esto (también mencionado aquí que tiene un par de enlaces a datos; y encontré un extracto de esa parte del libro ). Obviamente, esto es muy controvertido: básicamente dice que cuanto más publicitado sea un accidente aéreo, más probable es que influya en un piloto (consciente o inconscientemente) para que estrelle su avión. Pero las explicaciones psicológicas subyacentes a la hipótesis parecen plausibles, y los datos también parecen respaldarla.

(Los enlaces a la investigación de desacreditación basada en estadísticas serían bienvenidos, en los comentarios).

Darren Cook
fuente
No dice eso: dice "inmediatamente después de ciertos tipos de historias de suicidio muy publicitadas, aumenta el número de personas que mueren en accidentes de aerolíneas comerciales".
Scortchi - Restablece a Monica
La referencia para el reclamo es, creo, Phillips, (1978) "Las muertes por accidentes de aviación aumentan justo después de las historias de los periódicos sobre asesinatos y suicidios", Science , 201 , pp 748-750. El resumen se refiere a "aviones privados, comerciales y ejecutivos corporativos".
Scortchi - Restablece a Monica
O quizás este: Phillips (1980), "Accidentes de aviación, asesinatos y medios de comunicación: hacia una teoría de imitación y sugerencia", Social Forces , 58 , 4, donde se mencionan en resumen las "aerolíneas".
Scortchi - Restablece a Monica
2
Altheide (1981), Social Forces , 60 , 2 sugiere que un "cierto tipo de historia de suicidio altamente publicitada" puede no haberse definido de manera completamente independiente de los 'accidentes de avión posteriores - suena más bien como la definición de "famoso rabino" .
Scortchi - Restablece a Monica