¿Ejemplos de procesos que no son de Poisson?

15

Estoy buscando algunos buenos ejemplos de situaciones que no son adecuadas para modelar con una distribución de Poisson, para ayudarme a explicar la distribución de Poisson a los estudiantes.

Uno usa comúnmente el número de clientes que llegan a una tienda en un intervalo de tiempo como un ejemplo que puede ser modelado por una distribución de Poisson. Estoy buscando un contraejemplo en una línea similar, es decir, una situación que pueda considerarse como un proceso de conteo positivo en tiempo continuo que claramente no es Poisson.

Idealmente, la situación debe ser lo más simple y directa posible, para facilitar que los estudiantes puedan comprender y recordar.

Nagel
fuente
55
Esta pregunta es extraordinariamente amplia. A menos que el alcance se reduzca y se agregue algo más de contexto, es muy probable que termine cerrado. Sin querer sonar innecesariamente duro, es como preguntar: "¿Cuáles son algunos ejemplos de flores que no son rojas?" (Cue Harry Chapin.)
cardenal
1
Punto a favor. Mis disculpas. Debería haberlo hecho más específico. Lo edité para intentar aclararlo.
Nagel
1
(+1) to the question and comment. The update is much better. :-)
cardinal
2
Asumiré que te refieres a "procesos dados para los cuales las personas podrían considerar al menos ingenuamente un Poisson" (por ejemplo, al menos, un proceso de conteo). Un ejemplo común ocurre en el número de reclamos sobre pólizas de seguro general (seguro de propiedad y daños a terceros), debido a una serie de posibles factores, que se reflejan más claramente en la heterogeneidad en las tasas de reclamo, por lo que hay una superposición de procesos de Poisson con diferentes intensidades. En situaciones donde la distribución de las tasas de reclamo se aproxima bien por una distribución gamma, la distribución de recuentos de reclamos se aproxima a su vez por un binomio negativo.
Glen_b -Reinstale a Mónica el

Respuestas:

5

Number of cigarettes smoked in a period of time: this requires a zero-inflated process (e.g. zero-inflated Poisson or zero-inflated negative binomial) because not everyone smokes cigarettes.

Alexis
fuente
Thanks! Many here have mentioned zero-inflated processes, but I think this is the most straightforward and illustrative example that has been given: The number of cigarettes smoked by a randomly picked person in a period of time.
Nagel
Sin embargo, podría decirse que hay un problema con el argumento de "no todos fuman cigarrillos", en el sentido de que se podría afirmar que este proceso sigue siendo Poisson, solo que el parámetro de intensidad es específico para cada persona y desconocido (los no fumadores tendrían un muy pequeño intensidad) - ¿verdad? Sin embargo, también se podría argumentar que esta situación viola los supuestos de Poisson en el sentido de que los cigarrillos fumados tenderían a extenderse de manera uniforme durante el día (para los fumadores habituales) o agrupados (para los fumadores sociales), de modo que los intervalos de tiempo disjuntos no son independientes. Así que este sigue siendo un buen ejemplo, creo.
Nagel
1
El número de peces capturados en un período de tiempo es, creo, un ejemplo más canónico para ZIP y ZINB. Argumentos similares. Aunque, los peces no tienen el potencial de efectos adictivos sobre la tasa de consumo. (Lo sé, lo sé, excepto por los peces de tu madre, porque son tan buenos :).
Alexis
8

Do you mean positive count data? Unbounded?

The negative binomial is popular.

Otro buen modelo es el Poisson con 0. inflado. Ese modelo supone que algo está sucediendo o no, y si es así, sigue a un Poisson. Vi un ejemplo recientemente. Se preguntó a las enfermeras que trataban a pacientes con SIDA con qué frecuencia experimentaron comportamientos estigmatizantes de otros como resultado de su participación con pacientes con SIDA. Un gran número nunca había tenido tales experiencias, posiblemente debido a dónde trabajaban o vivían. De los que lo hicieron, el número de experiencias de estigmatización varió. Se informaron más 0 de lo que cabría esperar de un Poisson directo, básicamente porque una cierta proporción del grupo en estudio simplemente no estaba en un entorno que los expusiera a tales comportamientos.

Una mezcla de Poisson también le daría un proceso puntual.

Placidia
fuente
(+1) para la distribución de Poisson inflada a cero. Puede encontrar una discusión sobre este modelo aquí
1
+1 a esta (y otras respuestas) que proporcionan ejemplos reales de las situaciones mencionadas en la pregunta, en lugar de solo distribuciones abstractas. Este ejemplo de ZIP es particularmente claro.
whuber
1
To the credit of those who answered, I should point out that my question initially was far too sloppy, and didn't refer to situations at all. I agree that the zero-inflated Poisson is a good example. However, I find it a little too involved to explain to undergrad students, so I'm still missing examples of simple situations that cannot be modeled by a Poisson distribution.
Nagel
4

Counting processes that aren't Poisson? Well, any finite sample space process like binomial or discrete uniform. You get a Poisson counting process from counting events having independent interarrival times which are exponentially distributed, so a whole host of generalizations fall out of that such as having gamma or lognormal or Weibull distributed interarrival times, or any kind of abstract non-parametric interarrival time distribution.

AdamO
fuente
Thanks for your reply, and I am very sorry that my question initially was so unclear. I have clarified it now. What you say about processes with non-exponential and/or dependent interarrival times makes sense, but do you have any examples of situations that will have these properties, the simpler the better?
Nagel
4
You bet! Time between outbreaks of herpes virus. You have a much longer time to your initial outbreak because you must actually contract the virus. Your interarrival times between outbreaks thereafter are independent from one another, but come at a much faster rate relative to the index outbreak. Non-exponential interarrival times are the norm. In survival analysis, a commonly used analytic method is Cox Proportional Hazards models where you strip off any parametric assumptions about the interarrival times.
AdamO
Good example! I guess this is another instance of the zero-inflated Poisson mentioned by Placidia above?
Nagel
4

No está claro si desea contar procesos o no.

Si interpreto que la etiqueta de "enseñanza" significa que está enseñando el proceso de Poisson, entonces, para enseñar sobre un proceso en general, el proceso de Bernoulli es un proceso aleatorio fácil de explicar y visualizar y está relacionado con el proceso de Poisson. El proceso de Bernoulli es el análogo discreto, por lo que podría ser un concepto complementario útil. Es solo que, en lugar de tiempo continuo, tenemos intervalos de tiempo discretos.

Un ejemplo podría ser un vendedor de puerta en puerta donde estamos contando los éxitos de las casas que hacen una compra.

  • El número de éxitos en los primeros n ensayos tiene una
    distribución binomial B (n, p) en lugar de un Poisson
  • El número de ensayos necesarios para obtener r éxitos tiene una distribución binomial negativa NB (r, p) en lugar de una distribución gamma
  • El número de pruebas necesarias para obtener un éxito, el tiempo de espera, tiene una distribución geométrica NB (1, p), que es el análogo discreto del exponencial.

Ese es el enfoque que usan Bertsekas y Tsitsiklis en Introducción a la probabilidad , 2ª ed., Que presenta el proceso de Bernoulli antes del proceso de Poisson. En su libro de texto hay más extensiones para el proceso de Bernoulli que son aplicables al proceso de Poisson, como fusionarlas o particionarlas, así como conjuntos de problemas con soluciones.

Si está buscando ejemplos de procesos aleatorios, y solo desea lanzar los nombres, hay bastantes.

El proceso gaussiano es significativo en las aplicaciones. El proceso de Weiner en particular, que es un tipo de proceso gaussiano, también se llama movimiento browniano estándar y tiene aplicaciones en finanzas y física.

Alondra Bradsher
fuente
Gracias por su respuesta, y lamento mucho que mi pregunta inicialmente fuera tan improvisada y poco clara. He tratado de aclararlo ahora. El enlace de Bernoulli a Poisson es interesante, pero lo que estoy buscando son ejemplos de situaciones en tiempo continuo que no son adecuadas para ser modeladas por una distribución de Poisson, cuanto más simple, mejor.
Nagel
3

Como actuario de propiedad / accidente, trato con ejemplos de la vida real de procesos discretos que no son de Poisson todo el tiempo. Para las líneas de negocio de alta frecuencia y baja frecuencia, la distribución de Poisson no es adecuada, ya que exige una relación de varianza a media de 1. La distribución binomial negativa, mencionada anteriormente, se usa mucho más comúnmente, y las distribuciones de Delaporte se utiliza en parte de la literatura, aunque con menos frecuencia en la práctica actuarial norteamericana estándar.

Por qué esto es así es una pregunta más profunda. ¿El binomio negativo es mucho mejor porque representa un proceso de Poisson para el cual el parámetro medio está en sí mismo distribuido en gamma? ¿O es porque los sucesos de pérdida fallan en la independencia (como ocurre con los terremotos según la teoría actual de que cuanto más se espera que la tierra se deslice, más probable es que se deba a la acumulación de presión), es no estacionaria (los intervalos no se puede subdividir en secuencias, cada una de las cuales es estacionaria, lo que permitiría el uso de un Poisson no homogéneo), y ciertamente algunas líneas de negocios permiten sucesos simultáneos (por ejemplo, negligencia médica con múltiples médicos cubiertos por la política).

Abraham
fuente
2

Otros han mencionado varios ejemplos de procesos puntuales que no son de Poisson. Debido a que el Poisson corresponde a tiempos exponenciales entre llegadas si elige cualquier distribución de tiempo entre llegadas que no sea exponencial, el proceso puntual resultante no es Poisson. AdamO señaló el Weibull. Puede usar gamma, lognormal o beta como posibles opciones.

El Poisson tiene la propiedad de que su media es igual a su varianza. Un proceso puntual que tiene una varianza mayor que la media a veces se conoce como sobredispersado y si la media es mayor que la varianza está bajo dispersado. Estos términos se usan para relacionar el proceso con un Poisson. El binomio negativo se usa a menudo porque se puede dispersar de más o de menos según sus parámetros.

El Poisson tiene una varianza que es constante. Un proceso puntual que se ajusta a las condiciones de Poisson, excepto por no tener un parámetro de velocidad constante y, en consecuencia, una media y varianza variable en el tiempo se denomina Poisson no homogéneo.

Un proceso con tiempos entre llegadas exponenciales pero que puede tener múltiples eventos a la hora de llegada se llama Poisson compuesto. Aunque es similar al proceso de Poisson y tiene un nombre con la palabra Poisson, los procesos de Poisson no homogéneos y compuestos son diferentes de un proceso de punto de Poisson.

Michael R. Chernick
fuente
Gracias por su respuesta, y lamento mucho que mi pregunta inicialmente fuera tan improvisada y poco clara. He tratado de aclararlo ahora. Menciona procesos con tiempos de llegada no exponenciales y / o dependientes, y lo que dice sobre distribuciones sobredispersadas y subdispersadas es muy interesante, pero ¿tiene algún ejemplo de situaciones concretas que tengan estas propiedades? Cuanto más simple, mejor :)
Nagel
1
En lugar de tratar de dar mi propia respuesta, creo que hay muchos, muchos ejemplos que puedes encontrar en libros que tratan sobre procesos de conteo. Permítame recomendarle que mire el libro de Joe Hilbe sobre la regresión binomial negativa .
Michael R. Chernick
2

Otro ejemplo interesante de proceso de conteo no Poisson está representado por la distribución de Poisson truncada a cero (ZTPD). ZTPD puede ajustar datos sobre la cantidad de idiomas que los sujetos pueden hablar en condiciones fisiológicas. En este caso, la distribución de Poisson se comporta mal, porque el número de idiomas hablados es por definición> = 1: por lo tanto, 0 se descarta a priori.

Carlo Lazzaro
fuente
2

Creo que podría tomar su proceso de Poisson de llegada de clientes y modificarlo de dos maneras diferentes: 1) las llegadas de clientes se miden las 24 horas del día, pero la tienda no está abierta todo el día, y 2) imagine dos tiendas competidoras con Poisson procesa los horarios de llegada de los clientes y observa la diferencia entre las llegadas a las dos tiendas. (El Ejemplo # 2 es de mi comprensión del Manual Springer de Estadísticas de Ingeniería, Parte A, Propiedad 1.4.)

Wayne
fuente
1

You might want to reconsider the soccer example. It seems that the scoring rates for both teams increase as the match goes on, & that they change when teams change their attacking/defending priorities in response to the current score.

O, mejor dicho, úselo como un ejemplo de cómo los modelos simples pueden funcionar sorprendentemente bien, estimulando el interés en la investigación estadística de algún fenómeno y proporcionando un punto de referencia para futuros estudios que recopilen más datos para investigar discrepancias y proponer elaboraciones.

Dixon y Robinson (1998), "Un modelo de proceso de nacimiento para partidos de fútbol de asociación", The Statistician , 47 , 3.

Scortchi - Restablece a Monica
fuente
Tenía el presentimiento de que los partidos de fútbol no eran del todo Poisson, pero gracias por la referencia :)
Nagel
1

Since the question is related to making the Poisson distribution more understandable, I'll give it a go, since I recently looked into this somewhat for call center incoming call patterns (which follow a memory-less, exponential distribution as time goes on).

I think delving into another tangential model that essentially requires knowledge of Poisson to realize how it isn't one may be somewhat confusing, but that's just me.

I think the trouble with understanding Poisson is the continuous time axis it's on --- as every second goes on, the event is no more likely to occur --- but the further out in the future you go, the more certain it is of happening.

Realmente, creo que simplifica la comprensión si solo cambias el eje 'tiempo' por 'pruebas' o 'eventos'.

Alguien puede corregirme si esto está fuera de lugar, ya que creo que es una explicación fácil, pero creo que puede reemplazar el lanzamiento de una moneda o el lanzamiento de un dado, con 'tiempo hasta que llegue una llamada telefónica' (lo que yo normalmente se usa para el personal de Erlang C / call center).

En lugar de "tiempo hasta que lleguen las llamadas telefónicas", puede reemplazarlo con ... "tira hasta que un dado llegue a seis".

Eso sigue la misma lógica general. La probabilidad (como cualquier juego de apuestas) es completamente independiente en cada tirada (o minuto) y no tiene memoria. Sin embargo, la probabilidad de 'no 6' disminuye cada vez más lentamente, pero seguramente hacia 0 a medida que aumenta el número de ensayos. Es más fácil si ve ambos gráficos (probabilidad de llamada con tiempo, versus probabilidad de seis con rollos).

No sé si eso tiene sentido, eso es lo que me ayudó a ponerlo en términos concretos. Ahora, la distribución de Poisson es un recuento en lugar de "tiempo entre llamadas" o "pruebas hasta obtener un seis", pero se basa en esta probabilidad.

John Babson
fuente
Puedo ver cómo pensarías que esto podría ser confuso para los estudiantes, pero mi idea era simplemente que me facilitaría explicar por qué la cantidad de clientes que llegan a un restaurante en un intervalo de tiempo es Poisson, si tuviera un mostrador -ejemplo de un proceso simple con eventos discretos en tiempo continuo que no fue Poisson.
Nagel
1
Hay muchas opciones, creo. Un patrón obvio serían los eventos que aumentan o disminuyen en probabilidad con sus propias ocurrencias. Difícil pensar en algunos ejemplos. Quizás las hormigas lleguen a tu cocina / picnic. El tiempo que tarda la primera hormiga en llegar es probablemente mucho más largo que el segundo o el tercero, y por supuesto, más llegadas de hormigas significan más probabilidades de futuras llegadas de hormigas (dado que sus rastros / comunicación entre ellos). No estoy seguro si eso contaría.
John Babson
1

Número de visitas de un cliente individual a la tienda de comestibles dentro de un intervalo de tiempo determinado.

Después de haber estado en el supermercado, es poco probable que regrese por un tiempo a menos que haya cometido un error de planificación.

Creo que la distribución binomial negativa podría usarse aquí, pero es discreta, mientras que las visitas son continuas.

Josiah: Desactivador juvenil excepto ...
fuente