Prueba de hipótesis de Poisson para dos parámetros

9

Entonces, por diversión, tomo algunos de los datos de las llamadas del centro de atención telefónica en el que trabajo e intento hacer algunas pruebas de hipótesis sobre ellos, específicamente el número de llamadas recibidas en una semana, y uso una distribución de Poisson para ajustarlo. Debido al tema de mi trabajo, hay dos tipos de semanas, llamemos a uno de ellos en las semanas en las que supongo que hay más llamadas, y en las semanas fuera donde supongo que hay menos.

Tengo una teoría de que el de las semanas fuera (llamémoslo λ 1 ) es mayor que el del de fuera de las semanas (llamémoslo λ 2 )λλ1λ2

Entonces, la hipótesis que quiero probar es H0 0:λ1>λ2,H1:λ1λ2

Sé cómo probar un parámetro (digamos ) pero no estoy tan seguro de cómo hacer 2 dado un conjunto de datos. Digamos que tomo dos semanas de datos de cada uno X 1 = 2 y X 2 = 3 para la semana libre e Y 1 = 2 e Y 2 = 6 para la semana. ¿Alguien puede ayudarme a caminar a través de esta versión más simple para que pueda aplicarlo a un conjunto de datos más grande? Cualquier ayuda se agradece, gracias.H0 0:λ1>1,H1:λ11X1=2X2=3Y1=2Y2=6

James Snyder
fuente
3
¿Las llamadas son realmente poisson distribuidas? Si hay muchas llamadas, es mejor modelarlas como aproximadamente normales. Pero eso puede matar la diversión.
RegressForward
1
Bueno, ¿qué determina que así es como lo encuadras bien? Estoy recibiendo x número de llamadas discretas en el marco de tiempo de una unidad. Podría hacerlo como una distribución normal, pero lo importante es que me gustaría probarlo con Poisson, ya que encaja.
James Snyder
Si supone que los recuentos son de Poisson, puede agregarlos (corríjame si me equivoco). Es decir, obtendrías X = 2 + 3 e Y = 2 + 6. Luego puede probar una diferencia usando, por ejemplo, el 'poisson.test' en R. Si desea probar un análisis bayesiano, también tengo una publicación de blog sobre eso aquí: sumsar.net/blog/2014/ 09 / bayesian-first-aid-poisson-test
Rasmus Bååth

Respuestas:

4

Tenga en cuenta que normalmente la igualdad va en nulo (con buena razón).

Dejando ese tema a un lado, mencionaré un par de enfoques para probar este tipo de hipótesis.

  1. Una prueba muy simple: condición en el recuento total observado , que lo convierte en una prueba binomial de proporciones. Imagínese hay w en on-semana y w off off-semana y w semanas combinados.nortewenwapagadow

Luego, bajo la hipótesis nula, las proporciones esperadas son ywoffwenwwapagadow

  1. λ

Hay otras opiniones al respecto.

Glen_b -Reinstate a Monica
fuente
1

¿Qué pasa con el GLM con estructura de error de Poisson y enlace de registro? Pero la idea sobre binomio puede ser más poderosa.

Ivan Kshnyasev
fuente
En la actualidad, esto es más un comentario que una respuesta. ¿Lo intentaste como un comentario, una pregunta para aclarar o una respuesta? Si es lo último, ¿puede ampliarlo en más de respuesta? También podemos convertirlo en un comentario para usted.
gung - Restablece a Monica
1

Lo resolvería con un GLM de Poisson o Cuasi-Poisson con preferencia por un binomio cuasi-Poisson o negativo.

El problema con el uso de Poisson tradicional es que requiere que la varianza y la media sean iguales, lo que muy probablemente no sea el caso. El cuasi-Poisson o NB estima la varianza sin restricción de la media.

Podrías hacer cualquiera de estos en R muy fácilmente.

# week on = 1, week off = 0
week.status <- c(1, 1, 0, 0)
calls <- c(2, 6, 2, 3)
model <- glm(calls ~ week.status, family = poisson())
# or change the poisson() after family to quasipoisson() 
# or use the neg binomial glm from the MASS package

El enfoque GLM es beneficioso y puede expandirse para incluir variables adicionales (por ejemplo, mes del año) que podrían afectar el volumen de llamadas.

Para hacerlo a mano, probablemente usaría una aproximación normal y una prueba t de dos muestras.

iacobus
fuente
1

Comenzamos con la Estimación de máxima verosimilitud para el parámetro de Poisson, que es la media.

λ^1=Y¯  unanortere  λ^2=X¯

Y¯-X¯norte(λ1-λ2,λ1norte1+λ2norte2)

(Y¯-X¯)-λ1-λ2λ1norte1+λ2norte2

Z<CryotyoCunal Vunaltumi

Hemant Rupani
fuente
0

A partir de la página 125 de la hipótesis estadística de pruebas de Casella, se describe la respuesta al tipo de pregunta que ha formulado. He adjuntado un enlace a un pdf que encontré en línea para su referencia. Hipótesis estadística de las pruebas de Casella, tercera edición .

Nuzhi Meyen
fuente
Buen puntero, sin embargo, las respuestas de solo enlace se desaconsejan en Cross Validated. ¿Podría esbozar la resolución en su respuesta? Gracias.
Xi'an
Lo siento, no estaba al tanto de esa regla. Gracias por hacérmelo saber. :) Intentará dar una respuesta integral lo antes posible.
Nuzhi Meyen