Entonces, por diversión, tomo algunos de los datos de las llamadas del centro de atención telefónica en el que trabajo e intento hacer algunas pruebas de hipótesis sobre ellos, específicamente el número de llamadas recibidas en una semana, y uso una distribución de Poisson para ajustarlo. Debido al tema de mi trabajo, hay dos tipos de semanas, llamemos a uno de ellos en las semanas en las que supongo que hay más llamadas, y en las semanas fuera donde supongo que hay menos.
Tengo una teoría de que el de las semanas fuera (llamémoslo λ 1 ) es mayor que el del de fuera de las semanas (llamémoslo λ 2 )
Entonces, la hipótesis que quiero probar es
Sé cómo probar un parámetro (digamos ) pero no estoy tan seguro de cómo hacer 2 dado un conjunto de datos. Digamos que tomo dos semanas de datos de cada uno X 1 = 2 y X 2 = 3 para la semana libre e Y 1 = 2 e Y 2 = 6 para la semana. ¿Alguien puede ayudarme a caminar a través de esta versión más simple para que pueda aplicarlo a un conjunto de datos más grande? Cualquier ayuda se agradece, gracias.
fuente
Respuestas:
Tenga en cuenta que normalmente la igualdad va en nulo (con buena razón).
Dejando ese tema a un lado, mencionaré un par de enfoques para probar este tipo de hipótesis.
Luego, bajo la hipótesis nula, las proporciones esperadas son ywoffwenw wapagadow
Hay otras opiniones al respecto.
fuente
¿Qué pasa con el GLM con estructura de error de Poisson y enlace de registro? Pero la idea sobre binomio puede ser más poderosa.
fuente
Lo resolvería con un GLM de Poisson o Cuasi-Poisson con preferencia por un binomio cuasi-Poisson o negativo.
El problema con el uso de Poisson tradicional es que requiere que la varianza y la media sean iguales, lo que muy probablemente no sea el caso. El cuasi-Poisson o NB estima la varianza sin restricción de la media.
Podrías hacer cualquiera de estos en R muy fácilmente.
El enfoque GLM es beneficioso y puede expandirse para incluir variables adicionales (por ejemplo, mes del año) que podrían afectar el volumen de llamadas.
Para hacerlo a mano, probablemente usaría una aproximación normal y una prueba t de dos muestras.
fuente
Comenzamos con la Estimación de máxima verosimilitud para el parámetro de Poisson, que es la media.
fuente
A partir de la página 125 de la hipótesis estadística de pruebas de Casella, se describe la respuesta al tipo de pregunta que ha formulado. He adjuntado un enlace a un pdf que encontré en línea para su referencia. Hipótesis estadística de las pruebas de Casella, tercera edición .
fuente