Comparación de tasas de incidencia

9

Quiero comparar las tasas de incidencia entre dos grupos (uno sin enfermedad y otro con).

Estaba planeando calcular la tasa de incidencia (TIR), es decir, la tasa de incidencia del grupo B / tasa de incidencia del grupo A, y luego probar si esta tasa es igual a 1, y finalmente calcular los intervalos de IC del 95% para la TIR.

Encontré un método para calcular el IC del 95% en un libro ( Fundamentos de bioestadística de Rosner ):

exp[log(IRR)±1.96(1/a1)+(1/a2)]

donde y un 2 son el número de eventos. Pero esta aproximación solo es válida para tamaños de muestra lo suficientemente grandes y creo que el número de eventos que tengo es demasiado pequeño (tal vez para la comparación total está bien).a1a2

Así que creo que debería usar otro método.

Estoy usando R y el paquete exacto y descubrí que tal vez podría usar poisson.test(). Pero esta función tiene 3 métodos para definir los valores p de dos lados: central, minlike y blaker.

Entonces mis preguntas son:

  1. ¿Es correcto comparar dos tasas de incidencia utilizando una prueba para comparar las tasas de Poisson?

  2. Cuando se usa la función poisson.test en R desde el paquete exacto, ¿qué método es el mejor?

La viñeta de exactaci dice:

central: es 2 veces el mínimo de los valores p unilaterales limitados anteriormente por 1. El nombre 'central' está motivado por los intervalos de confianza de inversión asociados que son intervalos centrales, es decir, garantizan que el parámetro verdadero tiene menos de Probabilidad de ser menor (más) que la cola inferior (superior) del intervalo de confianza de 100 (1- α )%. Hirji (2006) llama a esto TST (el doble del método de la cola más pequeña).α/2α

minlike: es la suma de las probabilidades de resultados con probabilidades menores o iguales a la probabilidad observada. Hirji (2006) llama al método PB (basado en la probabilidad).

blaker: combina la probabilidad de la cola más pequeña observada con la probabilidad más pequeña de la cola opuesta que no exceda esa probabilidad de cola observada. El nombre 'blaker' está motivado por Blaker (2000) que estudia exhaustivamente el método asociado para intervalos de confianza. Hirji (2006) llama el método CT (cola combinada).

Mis datos son:

Group A: 
Age group 1: 3 cases    in 10459 person yrs.   Incidence rate: 0.29 
Age group 2: 7 cases    in 2279 person yrs.    Incidence rate: 3.07
Age group 3: 4 cases    in 1990 person yrs.    Incidence rate: 2.01
Age group 4: 9 cases    in 1618 person yrs.    Incidence rate: 5.56
Age group 5: 11 cases   in 1357 person yrs.    Incidence rate: 8.11
Age group 6: 11 cases   in 1090 person yrs.    Incidence rate: 10.09
Age group 7: 9 cases    in 819 person yrs.     Incidence rate: 10.99
  Total:    54 cases in 19612 person yrs.      Incidence rate: 2.75

Group B: 
Age group 1: 3 cases    in 3088 person yrs.   Incidence rate: 0.97 
Age group 2: 1 cases    in 707 person yrs.    Incidence rate: 1.41
Age group 3: 2 cases    in 630 person yrs.    Incidence rate: 3.17
Age group 4: 6 cases    in 441 person yrs.    Incidence rate: 13.59
Age group 5: 10 cases   in 365 person yrs.    Incidence rate: 27.4
Age group 6: 6 cases   in 249 person yrs.    Incidence rate: 24.06
Age group 7: 0 cases    in 116 person yrs.     Incidence rate: 0
  Total:    28 cases in 5597 person yrs.      Incidence rate: 5.0
Edwin
fuente

Respuestas:

2

Un par de pensamientos:

Primero, su comparación sugerida, la relación de tasa de incidentes entre A y B, actualmente no está condicionada a ninguna covariable. Lo que significa que su número de eventos es 54 para el Grupo A y 28 para el Grupo B. Eso es más que suficiente para ir con los métodos habituales de intervalo de confianza basados ​​en muestras grandes.

En segundo lugar, incluso si tiene la intención de ajustar el efecto de la edad, en lugar de calcular la proporción para cada grupo, podría ser mejor que utilice un enfoque de regresión. En general, si está estratificando por muchos niveles de una variable, se vuelve bastante engorroso en comparación con una ecuación de regresión, lo que le daría la proporción de las tasas de A y B mientras controla la edad. Creo que los enfoques estándar seguirán funcionando para el tamaño de su muestra, aunque si le preocupa, podría usar algo como glmperm .

Fomite
fuente
1

La tasa de incidencia de cada grupo en sus datos es solo la media de una suma de variables independientes de Bernoulli (0/1): cada paciente tiene su propia variable que recibe un valor de 0 o 1, usted los suma y toma la media, que es la tasa de incidencia

Si las muestras son grandes (y su muestra es grande), la media se distribuirá normalmente, por lo que puede usar una prueba z simple para probar si las dos tasas son diferentes o no.

En R, eche un vistazo a prop.test: http://stat.ethz.ch/R-manual/R-patched/library/stats/html/prop.test.html

Si desea hacer un uso completo de los datos, intente ver si la distribución de las tasas de incidencia es diferente entre el grupo A y B. Para eso, una prueba de independencia podría ser útil, como un chi-cuadrado de un G -test: http://udel.edu/~mcdonald/statchiind.html

Ron
fuente
0

La única forma de asegurarse de que la muestra sea lo suficientemente grande (o como diría Charlie Geyer, que en realidad se encuentra en tierra de asimetopia ) es hacer una gran cantidad de simulación de Montecarlo o como EpiGard sugirió usar algo como glmperm.

En cuanto a qué método es mejor en exacto, no hay mejor aquí, o como solía decir Fisher

¿Lo mejor para qué?

Michael Fay proporciona algunas aclaraciones aquí

Phaneron
fuente