Estoy buscando algunos buenos ejemplos de situaciones que no son adecuadas para modelar con una distribución de Poisson, para ayudarme a explicar la distribución de Poisson a los estudiantes.
Uno usa comúnmente el número de clientes que llegan a una tienda en un intervalo de tiempo como un ejemplo que puede ser modelado por una distribución de Poisson. Estoy buscando un contraejemplo en una línea similar, es decir, una situación que pueda considerarse como un proceso de conteo positivo en tiempo continuo que claramente no es Poisson.
Idealmente, la situación debe ser lo más simple y directa posible, para facilitar que los estudiantes puedan comprender y recordar.
Respuestas:
Number of cigarettes smoked in a period of time: this requires a zero-inflated process (e.g. zero-inflated Poisson or zero-inflated negative binomial) because not everyone smokes cigarettes.
fuente
Do you mean positive count data? Unbounded?
The negative binomial is popular.
Otro buen modelo es el Poisson con 0. inflado. Ese modelo supone que algo está sucediendo o no, y si es así, sigue a un Poisson. Vi un ejemplo recientemente. Se preguntó a las enfermeras que trataban a pacientes con SIDA con qué frecuencia experimentaron comportamientos estigmatizantes de otros como resultado de su participación con pacientes con SIDA. Un gran número nunca había tenido tales experiencias, posiblemente debido a dónde trabajaban o vivían. De los que lo hicieron, el número de experiencias de estigmatización varió. Se informaron más 0 de lo que cabría esperar de un Poisson directo, básicamente porque una cierta proporción del grupo en estudio simplemente no estaba en un entorno que los expusiera a tales comportamientos.
Una mezcla de Poisson también le daría un proceso puntual.
fuente
Counting processes that aren't Poisson? Well, any finite sample space process like binomial or discrete uniform. You get a Poisson counting process from counting events having independent interarrival times which are exponentially distributed, so a whole host of generalizations fall out of that such as having gamma or lognormal or Weibull distributed interarrival times, or any kind of abstract non-parametric interarrival time distribution.
fuente
No está claro si desea contar procesos o no.
Si interpreto que la etiqueta de "enseñanza" significa que está enseñando el proceso de Poisson, entonces, para enseñar sobre un proceso en general, el proceso de Bernoulli es un proceso aleatorio fácil de explicar y visualizar y está relacionado con el proceso de Poisson. El proceso de Bernoulli es el análogo discreto, por lo que podría ser un concepto complementario útil. Es solo que, en lugar de tiempo continuo, tenemos intervalos de tiempo discretos.
Un ejemplo podría ser un vendedor de puerta en puerta donde estamos contando los éxitos de las casas que hacen una compra.
distribución binomial B (n, p) en lugar de un Poisson
Ese es el enfoque que usan Bertsekas y Tsitsiklis en Introducción a la probabilidad , 2ª ed., Que presenta el proceso de Bernoulli antes del proceso de Poisson. En su libro de texto hay más extensiones para el proceso de Bernoulli que son aplicables al proceso de Poisson, como fusionarlas o particionarlas, así como conjuntos de problemas con soluciones.
Si está buscando ejemplos de procesos aleatorios, y solo desea lanzar los nombres, hay bastantes.
El proceso gaussiano es significativo en las aplicaciones. El proceso de Weiner en particular, que es un tipo de proceso gaussiano, también se llama movimiento browniano estándar y tiene aplicaciones en finanzas y física.
fuente
Como actuario de propiedad / accidente, trato con ejemplos de la vida real de procesos discretos que no son de Poisson todo el tiempo. Para las líneas de negocio de alta frecuencia y baja frecuencia, la distribución de Poisson no es adecuada, ya que exige una relación de varianza a media de 1. La distribución binomial negativa, mencionada anteriormente, se usa mucho más comúnmente, y las distribuciones de Delaporte se utiliza en parte de la literatura, aunque con menos frecuencia en la práctica actuarial norteamericana estándar.
Por qué esto es así es una pregunta más profunda. ¿El binomio negativo es mucho mejor porque representa un proceso de Poisson para el cual el parámetro medio está en sí mismo distribuido en gamma? ¿O es porque los sucesos de pérdida fallan en la independencia (como ocurre con los terremotos según la teoría actual de que cuanto más se espera que la tierra se deslice, más probable es que se deba a la acumulación de presión), es no estacionaria (los intervalos no se puede subdividir en secuencias, cada una de las cuales es estacionaria, lo que permitiría el uso de un Poisson no homogéneo), y ciertamente algunas líneas de negocios permiten sucesos simultáneos (por ejemplo, negligencia médica con múltiples médicos cubiertos por la política).
fuente
Otros han mencionado varios ejemplos de procesos puntuales que no son de Poisson. Debido a que el Poisson corresponde a tiempos exponenciales entre llegadas si elige cualquier distribución de tiempo entre llegadas que no sea exponencial, el proceso puntual resultante no es Poisson. AdamO señaló el Weibull. Puede usar gamma, lognormal o beta como posibles opciones.
El Poisson tiene la propiedad de que su media es igual a su varianza. Un proceso puntual que tiene una varianza mayor que la media a veces se conoce como sobredispersado y si la media es mayor que la varianza está bajo dispersado. Estos términos se usan para relacionar el proceso con un Poisson. El binomio negativo se usa a menudo porque se puede dispersar de más o de menos según sus parámetros.
El Poisson tiene una varianza que es constante. Un proceso puntual que se ajusta a las condiciones de Poisson, excepto por no tener un parámetro de velocidad constante y, en consecuencia, una media y varianza variable en el tiempo se denomina Poisson no homogéneo.
Un proceso con tiempos entre llegadas exponenciales pero que puede tener múltiples eventos a la hora de llegada se llama Poisson compuesto. Aunque es similar al proceso de Poisson y tiene un nombre con la palabra Poisson, los procesos de Poisson no homogéneos y compuestos son diferentes de un proceso de punto de Poisson.
fuente
Otro ejemplo interesante de proceso de conteo no Poisson está representado por la distribución de Poisson truncada a cero (ZTPD). ZTPD puede ajustar datos sobre la cantidad de idiomas que los sujetos pueden hablar en condiciones fisiológicas. En este caso, la distribución de Poisson se comporta mal, porque el número de idiomas hablados es por definición> = 1: por lo tanto, 0 se descarta a priori.
fuente
Creo que podría tomar su proceso de Poisson de llegada de clientes y modificarlo de dos maneras diferentes: 1) las llegadas de clientes se miden las 24 horas del día, pero la tienda no está abierta todo el día, y 2) imagine dos tiendas competidoras con Poisson procesa los horarios de llegada de los clientes y observa la diferencia entre las llegadas a las dos tiendas. (El Ejemplo # 2 es de mi comprensión del Manual Springer de Estadísticas de Ingeniería, Parte A, Propiedad 1.4.)
fuente
You might want to reconsider the soccer example. It seems that the scoring rates for both teams increase as the match goes on, & that they change when teams change their attacking/defending priorities in response to the current score.
O, mejor dicho, úselo como un ejemplo de cómo los modelos simples pueden funcionar sorprendentemente bien, estimulando el interés en la investigación estadística de algún fenómeno y proporcionando un punto de referencia para futuros estudios que recopilen más datos para investigar discrepancias y proponer elaboraciones.
Dixon y Robinson (1998), "Un modelo de proceso de nacimiento para partidos de fútbol de asociación", The Statistician , 47 , 3.
fuente
Since the question is related to making the Poisson distribution more understandable, I'll give it a go, since I recently looked into this somewhat for call center incoming call patterns (which follow a memory-less, exponential distribution as time goes on).
I think delving into another tangential model that essentially requires knowledge of Poisson to realize how it isn't one may be somewhat confusing, but that's just me.
I think the trouble with understanding Poisson is the continuous time axis it's on --- as every second goes on, the event is no more likely to occur --- but the further out in the future you go, the more certain it is of happening.
Realmente, creo que simplifica la comprensión si solo cambias el eje 'tiempo' por 'pruebas' o 'eventos'.
Alguien puede corregirme si esto está fuera de lugar, ya que creo que es una explicación fácil, pero creo que puede reemplazar el lanzamiento de una moneda o el lanzamiento de un dado, con 'tiempo hasta que llegue una llamada telefónica' (lo que yo normalmente se usa para el personal de Erlang C / call center).
En lugar de "tiempo hasta que lleguen las llamadas telefónicas", puede reemplazarlo con ... "tira hasta que un dado llegue a seis".
Eso sigue la misma lógica general. La probabilidad (como cualquier juego de apuestas) es completamente independiente en cada tirada (o minuto) y no tiene memoria. Sin embargo, la probabilidad de 'no 6' disminuye cada vez más lentamente, pero seguramente hacia 0 a medida que aumenta el número de ensayos. Es más fácil si ve ambos gráficos (probabilidad de llamada con tiempo, versus probabilidad de seis con rollos).
No sé si eso tiene sentido, eso es lo que me ayudó a ponerlo en términos concretos. Ahora, la distribución de Poisson es un recuento en lugar de "tiempo entre llamadas" o "pruebas hasta obtener un seis", pero se basa en esta probabilidad.
fuente
Número de visitas de un cliente individual a la tienda de comestibles dentro de un intervalo de tiempo determinado.
Después de haber estado en el supermercado, es poco probable que regrese por un tiempo a menos que haya cometido un error de planificación.
Creo que la distribución binomial negativa podría usarse aquí, pero es discreta, mientras que las visitas son continuas.
fuente