Las águilas etiquetadas por satélite están desaparecidas en Escocia, y la tabla anterior muestra el destino de la etiqueta por modelo de etiqueta. Estoy particularmente interesado en esas etiquetas que están "detenidas, sin mal funcionamiento", porque es posible que estas aves también estén siendo asesinadas y que los cuerpos y las etiquetas sean eliminados.
He visto que esta tabla y solo esta tabla es evidencia de que "Incluso con el análisis estadístico más remoto, está claro que hay relaciones entre" Detenido - Sin mal funcionamiento "y el tipo de etiqueta utilizada" Así que mi pregunta es, ¿puede esto declaración de copia de seguridad?
42/135 (31%) tags stopped for all types
8/17 (47%) tags stopped for 80NS
29/77 (38%) tags stopped for 70GPS
3/22 (14%) tags stopped for 105GPS
2/13 (15%) tags stopped for 70GSM
0/6 (0%) tags stopped for 95BTOGSM
Entonces, supongo que la afirmación es cierta si la tasa de falla 80NS del 47% es significativamente peor que el promedio global del 31%. Y no sería cierto si la probabilidad de obtener 8 fallas en una muestra aleatoria de 17 etiquetas de las 135 fuera realmente alta. Más abstractamente, si hubiera 42 bolas negras y 93 bolas blancas en una bolsa y escogiera 17 al azar, ¿cuál es la probabilidad de que escoja 8 negras y 9 blancas?
Puedo calcular la probabilidad de que los primeros 8 sean negros como (42/135) * (41/134), etc., pero estoy atrapado tratando de determinar la probabilidad de que 8 de los 17 sean negros
EDITAR: Las etiquetas satelitales se unieron a las aves durante un período de 13 años, 2004 a 2016. Esta tabla muestra 131 etiquetas en lugar de 135. Se excluyeron 4 etiquetas porque no pudieron determinar la ubicación precisa de implementación de cuatro etiquetas iniciales.
Aquí hay otra tabla del informe que muestra algunos datos sobre la vida útil de las etiquetas 70GPS / 70GSM:
Respuestas:
Encontré una manera de llegar a mi respuesta de este comentario " busque la distribución hipergeométrica " en math.stackexchange:
De la entrada de Wikipedia sobre distribución hipergeométrica
Luego, usando una calculadora hipergeométrica en línea y las siguientes cifras:
Población: 135
Número de éxitos en población: 42
Tamaño de muestra: 17
Número de éxitos en la muestra: 8
Encuentro que la probabilidad de obtener exactamente 8 es 0.0703, y la probabilidad de obtener 8 o más es 0.1095
Creo que la cifra de "8 o más" es la relevante en este caso, y tengo que decir que esta probabilidad es menor de lo previsto por mi intuición.
Por lo tanto, los números sugieren que hay un 89% de probabilidad de que haya algo diferente en la tasa de falla cuando se segrega por tipo de etiqueta. Eso no significa que la causa de la diferencia sea el tipo de etiqueta.
fuente