Tengo dos proporciones (p. Ej., Porcentaje de clics (CTR) en un enlace en un diseño de control y CTR en un enlace en un diseño experimental), y quiero calcular un intervalo de confianza del 95% en torno a la proporción de estas proporciones.
¿Cómo hago esto? Sé que puedo usar el método delta para calcular la varianza de esta relación, pero no estoy seguro de qué hacer además de eso. ¿Qué debo usar como punto medio del intervalo de confianza (mi relación observada o la relación esperada que es diferente) y cuántas desviaciones estándar alrededor de esta relación debo tomar?
¿Debo usar la variación del método delta? (Realmente no me importa la varianza, solo un intervalo de confianza). ¿Debo usar el Teorema de Fieller , usando el Caso 1 (dado que estoy haciendo proporciones, supongo que cumplo con el requisito de distribución normal)? ¿Debo calcular una muestra de bootstrap?
fuente
Respuestas:
La forma estándar de hacer esto en epidemiología (donde una relación de proporciones generalmente se conoce como relación de riesgo ) es primero transformar la relación logarítmica, calcular un intervalo de confianza en la escala logarítmica utilizando el método delta y asumiendo una distribución normal, luego transforma de nuevo. Esto funciona mejor en tamaños de muestra moderados que usar el método delta en la escala no transformada, aunque aún se comportará mal si el número de eventos en cualquiera de los grupos es muy pequeño, y falla completamente si no hay eventos en ninguno de los grupos.
Si hay y x 2 éxitos en los dos grupos fuera de los totales n 1 y n 2 , entonces la estimación obvio para la relación de proporciones es θ = x 1 / n 1x1 x2 n1 n2
Utilizando el método delta y suponiendo que los dos grupos son independientes y los éxitos se distribuyen binomial, se puede mostrar que Tomando la raíz cuadrada de este da el error estándar SE ( log θ ) . Suponiendo que log θ se distribuye normalmente, un intervalo de confianza del 95% para log θ
fuente