Comprobando si dos muestras de Poisson tienen la misma media

30

Esta es una pregunta elemental, pero no pude encontrar la respuesta. Tengo dos mediciones: n1 eventos en el tiempo t1 y n2 eventos en el tiempo t2, ambos producidos (por ejemplo) por procesos de Poisson con valores lambda posiblemente diferentes.

Esto es en realidad de un artículo de noticias, que esencialmente afirma que desde que los dos son diferentes, pero no estoy seguro de que el reclamo sea válido. Suponga que los períodos de tiempo no se eligieron maliciosamente (para maximizar los eventos en uno u otro).n1/t1n2/t2

¿Puedo hacer una prueba t o eso no sería apropiado? El número de eventos es demasiado pequeño para que pueda llamar cómodamente a las distribuciones aproximadamente normales.

Charles
fuente
1
Buen espécimen de periodismo científico, allí ...
Matt Parker
1
Sí ... puedes ver por qué quería verificar las estadísticas utilizadas.
Charles

Respuestas:

25

Para probar la media de Poisson, el método condicional fue propuesto por Przyborowski y Wilenski (1940). La distribución condicional de X1 dada X1 + X2 sigue una distribución binomial cuya probabilidad de éxito es una función de la razón dos lambda. Por lo tanto, las pruebas de hipótesis y los procedimientos de estimación de intervalos se pueden desarrollar fácilmente a partir de los métodos exactos para hacer inferencias sobre la probabilidad de éxito binomial. Por lo general, se consideran dos métodos para este propósito,

  1. Prueba C
  2. E-test

Puede encontrar los detalles sobre estas dos pruebas en este documento. Una prueba más poderosa para comparar dos medias de Poisson

Wazir
fuente
44
+1 Buena referencia, gracias. La prueba C es una versión más rigurosa de la que bosquejé, por lo que vale la pena considerarla. La prueba E relaciona una estadística t con una distribución apropiada. Calcular esa distribución implica una suma infinita doble que tomará cálculos de para converger: bastante fácil de codificar, ¡probablemente exagerado para revisar el periódico! O(n1n2)
whuber
1
El autor del documento E-test escribió una implementación simple de fortran para calcular los valores p para dos medios de poisson aquí: ucs.louisiana.edu/~kxk4695 Porté su fortran a MATLAB aquí git.io/vNP86
AndyL
11

Qué tal si:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Esta es una prueba que compara las tasas de Poisson de 1 y 2 entre sí, y proporciona un valor p y un intervalo de confianza del 95%.

Rob van Gemert
fuente
Cabe señalar que para un problema de dos muestras, esto utiliza una prueba binomial para comparar tasas
Jon
10

Estás buscando un control rápido y fácil.

λt=t1+t2[0 0,t1]norte1[t1,t1+t2]norte2

λ^=norte1+norte2t1+t2

norteyotyoλ^norteyo

whuber
fuente
1
Gracias (+1), esa es la comprobación correcta para este tipo de cosas extravagantes. Terminó siendo muy significativo (p = 0.005) por lo que el artículo está bien. Sin embargo, espero que no te importe que acepté la otra respuesta: es bueno saber la forma 'real' de hacerlo cuando es importante.
Charles
5

Me interesaría más un intervalo de confianza que un valor p, aquí hay una aproximación de arranque.

Calculando las longitudes de los intervalos primero, y un cheque:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Esta verificación da un resultado ligeramente diferente (aumento del 100.03%) que el de la publicación (aumento del 101%). Continúa con el bootstrap (hazlo dos veces):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

El intervalo de confianza del 95% del aumento es del 31% al 202%.

GaBorgulya
fuente