He leído las respuestas existentes en CrossValidated (más en otro lugar en línea) y no puedo encontrar lo que estoy buscando, pero sírvase señalarme las fuentes existentes si las he perdido.
Digamos que tengo un conjunto de datos de N = 1000 registros, cada uno de los cuales puede muestrearse manualmente y etiquetarse como 'Válido' o 'No válido' (o Verdadero / Falso, Correcto / Incorrecto, etc.).
Quiero lograr un nivel de confianza dado de que todos los registros en el conjunto de datos son válidos. A medida que muestro registros, si encuentro uno solo no válido, volvería y enmendaría cómo se crea el conjunto de datos para rectificar eso y problemas similares.
Entonces, después de algunas iteraciones de detectar inválidos, arreglar y recrear el conjunto de datos, realizo un muestreo que solo incluye registros válidos. Si quiero estar (digamos) 99% o 95% seguro de que todos los registros son válidos, ¿qué tamaño tiene que tener mi muestra? (Idealmente en función de N.)
He intentado jugar con pruebas hipergeométricas ( http://en.wikipedia.org/wiki/Hypergeometric_distribution#Hypergeometric_test ); en ese contexto, quiero saber qué debería ser k, pero no tengo un valor fijo de K Más bien, quiero elegir k de modo que sea probable que K sea igual a N, ¡pero establecer K = N obviamente resulta en una probabilidad de 1! También me pregunto si necesito usar un enfoque bayesiano, pero no entiendo las estadísticas bayesianas lo suficiente.
fuente
Respuestas:
Esto se puede enmarcar como una prueba de la hipótesis nula de que hay algunos registros no válidos en el conjunto de datos ( ) frente a la alternativa de que no hay ninguno ( ), dado que no se encontraron registros no válidos en la muestra ( ). El nulo proximal, el más difícil de rechazar, es que hay un único registro no válido ( ). Sustituya estos en la función de masa de probabilidad hipergeométrica para una muestra de tamaño de un conjunto de datos de tamaño para obtener el valor p (no hay posibles valores más pequeños de para ser considerados):K>0 K=0 k=0 K=1 n N k
Entonces, el tamaño mínimo de muestra requerido para poder rechazar la hipótesis nula en un nivel de significación (o equivalente para obtener un intervalo de confianza unilateral de ) es simplementen∗ p α=1−p K=0
Con y , . Si eso parece mucho, considere que la validez de todos los mil registros es un criterio estricto; si considera relajarlo, puede usar el mismo enfoque para probar, digamos .N=1000 α=0.95 n∗=950 K>9
fuente