Soy un diseñador de software de profesión y estoy trabajando en un proyecto para un cliente, y me gustaría asegurarme de que mi análisis sea estadísticamente sólido.
Considere lo siguiente: tenemos n anuncios (n <10), y simplemente queremos saber qué anuncio tiene el mejor rendimiento. Nuestro servidor de anuncios publicará aleatoriamente uno de estos anuncios. El éxito es si un usuario hace clic en el anuncio; nuestro servidor realiza un seguimiento de eso.
Dado: Intervalo de confianza: 95%
Pregunta: ¿Cuál es el tamaño de muestra estimado? (¿Cuántos anuncios totales debemos servir?) ¿Por qué? (recuerda que soy un tonto)
Gracias
anova
sample-size
t-test
rule-of-thumb
Jonathan
fuente
fuente
Respuestas:
La prueba que probablemente desee es la prueba exacta de Fisher . Desafortunadamente, dada la probable tasa de clics muy baja y el pequeño tamaño de efecto esperado, necesitará una enorme N para lograr el intervalo de confianza que desea. Digamos que el porcentaje de clics "verdadero" de su mejor anuncio es .11, y su segundo mejor .1. Además, supongamos que desea que la probabilidad de que no rechace incorrectamente la hipótesis nula (que no hay diferencia entre los dos anuncios) sea inferior a .20. Si es así, necesitará una N del orden de 10,000.
Como sugirió un comentarista, es probable que no le importe una diferencia del diez por ciento en el rendimiento de los anuncios. Para diferencias más graves, el tamaño necesario de las muestras disminuye rápidamente.
fuente