¿Qué distribución usar para modelar el tiempo antes de que llegue un tren?

15

Estoy tratando de modelar algunos datos sobre los horarios de llegada del tren. Me gustaría usar una distribución que capture "cuanto más espere, más probabilidades habrá de que el tren aparezca" . Parece que tal distribución debería verse como un CDF, de modo que P (aparición del tren | esperado 60 minutos) está cerca de 1. ¿Qué distribución es apropiada para usar aquí?

foobar
fuente
10
Si espera 25 horas y no ha habido ningún tren, sospecho que la posibilidad de que un tren aparezca en el próximo minuto puede estar cerca de ya que es muy posible que la línea se haya cerrado temporal o permanentemente0
Henry
@ Henry, esto depende completamente de tu creencia en las probabilidades anteriores. Por ejemplo, la estación de ferrocarril menos utilizada en Gran Bretaña, theguardian.com/uk-news/2016/dec/09/… , tiene brechas de llegadas durante más de un día (los domingos no hay servicio).
Sextus Empiricus
@MartijnWeterings: tal vez gracias a los periodistas, Shippea Hill experimentó un aumento del 1200% en el uso y ni siquiera hizo los 10 más bajos el año siguiente , algunos de los cuales, como el aeropuerto de Teesside, tienen un tren por semana en una dirección
Henry

Respuestas:

17

Multiplicación de dos probabilidades.

La probabilidad de una primera llegada a la vez entre y (el tiempo de espera) es igual a la multiplicación dett+dt

  • La probabilidad de una llegada entre y (que puede estar relacionada con la tasa de llegada en el tiempo )tt+dts(t)t
  • y la probabilidad de no llegar antes del tiempo (o de lo contrario no sería el primero).t

Este último término está relacionado con:

P(n=0,t+dt)=(1s(t)dt)P(n=0,t)

o

P(n=0,t)t=s(t)P(n=0,t)

dando:

P(n=0,t)=e0ts(t)dt

y la distribución de probabilidad para los tiempos de espera es:

f(t)=s(t)e0ts(t)dt

Derivación de la distribución acumulativa.

Alternativamente, puede usar la expresión para la probabilidad de menos de una llegada condicional de que el tiempo seat

P(n<1|t)=F(n=0;t)

y la probabilidad de llegada entre el tiempo y es igual a la derivadatt+dt

farrival time(t)=ddtF(n=0|t)

Este enfoque / método es, por ejemplo, útil para derivar la distribución gamma como el tiempo de espera para la enésima llegada en un proceso de Poisson. ( tiempo de espera-de-proceso-poisson-sigue-distribución-gamma )


Dos ejemplos

Puede relacionar esto con la paradoja de espera ( explique la paradoja de espera ).

  • Distribución exponencial: si las llegadas son aleatorias como un proceso de Poisson, entonces es constante. La probabilidad de una próxima llegada es independiente del tiempo de espera anterior sin llegada (por ejemplo, si lanza un dado justo muchas veces sin seis, entonces para la próxima tirada de repente no tendrá una mayor probabilidad de un seis, vea la falacia del jugador ) . Obtendrá la distribución exponencial, y el pdf para los tiempos de espera es:s(t)=λf ( t ) = λ e - λ t

    f(t)=λeλt

  • Distribución constante: si las llegadas se producen a una velocidad constante (como los trenes que llegan de acuerdo con un horario fijo), entonces la probabilidad de una llegada, cuando una persona ya ha estado esperando durante algún tiempo, está aumentando. Digamos que se supone que un tren llega cada minutos, luego la frecuencia, después de esperar minutos es y el pdf para el tiempo de espera será: cual tiene sentido ya que cada vez entre y debería tener la misma probabilidad de ser la primera llegada.Tts(t)=1/(Tt)

    f(t)=e0t1TtdtTt=1T
    0T


Por lo tanto, es este segundo caso, con "entonces aumenta la probabilidad de una llegada, cuando una persona ya ha estado esperando durante algún tiempo" , lo que se relaciona con su pregunta.

Es posible que necesite algunos ajustes según su situación. Con más información, la probabilidad de que un tren llegue en un momento determinado podría ser una función más compleja.s(t)dt


Escrito por StackExchangeStrike

Sexto Empírico
fuente
7

La distribución clásica para modelar los tiempos de espera es la distribución exponencial .

La distribución exponencial se produce naturalmente cuando se describen las longitudes de los tiempos entre llegadas en un proceso de Poisson homogéneo.

Stephan Kolassa
fuente
2
Sí, pero me atrevo a decir que un proceso de Poisson no es un buen modelo para una red de trenes.
Leftaroundabout