Análisis estadístico de las águilas desaparecidas.

8

Resumen del destino de la etiqueta por modelo de etiqueta

Las águilas etiquetadas por satélite están desaparecidas en Escocia, y la tabla anterior muestra el destino de la etiqueta por modelo de etiqueta. Estoy particularmente interesado en esas etiquetas que están "detenidas, sin mal funcionamiento", porque es posible que estas aves también estén siendo asesinadas y que los cuerpos y las etiquetas sean eliminados.

He visto que esta tabla y solo esta tabla es evidencia de que "Incluso con el análisis estadístico más remoto, está claro que hay relaciones entre" Detenido - Sin mal funcionamiento "y el tipo de etiqueta utilizada" Así que mi pregunta es, ¿puede esto declaración de copia de seguridad?

42/135  (31%) tags stopped for all types 
 8/17   (47%) tags stopped for 80NS     
29/77   (38%) tags stopped for 70GPS    
 3/22   (14%) tags stopped for 105GPS   
 2/13   (15%) tags stopped for 70GSM    
 0/6     (0%) tags stopped for 95BTOGSM 

Entonces, supongo que la afirmación es cierta si la tasa de falla 80NS del 47% es significativamente peor que el promedio global del 31%. Y no sería cierto si la probabilidad de obtener 8 fallas en una muestra aleatoria de 17 etiquetas de las 135 fuera realmente alta. Más abstractamente, si hubiera 42 bolas negras y 93 bolas blancas en una bolsa y escogiera 17 al azar, ¿cuál es la probabilidad de que escoja 8 negras y 9 blancas?

Puedo calcular la probabilidad de que los primeros 8 sean negros como (42/135) * (41/134), etc., pero estoy atrapado tratando de determinar la probabilidad de que 8 de los 17 sean negros


EDITAR: Las etiquetas satelitales se unieron a las aves durante un período de 13 años, 2004 a 2016. Esta tabla muestra 131 etiquetas en lugar de 135. Se excluyeron 4 etiquetas porque no pudieron determinar la ubicación precisa de implementación de cuatro etiquetas iniciales.

Tipo de etiqueta por año de etiqueta

Aquí hay otra tabla del informe que muestra algunos datos sobre la vida útil de las etiquetas 70GPS / 70GSM:

Detenido sin etiqueta de mal funcionamiento duración de la operación

Colin
fuente
2
Colin, tu pregunta carece de una variable clave: tiempo desde que se aplicó la etiqueta. También es posible que otras variables se confundan con el modelo de etiqueta: por ejemplo, tal vez se usan diferentes modelos en diferentes especies, o aves de diferentes tamaños, o algunas son más viejas y otras más jóvenes. Suponiendo, entonces, que este es un problema real de verdadera preocupación, considere incluir dichos datos en su análisis.
whuber
2
@Antoine Puedo ver por qué pensaste que era tarea, pero me temo que soy demasiado viejo para hacer la tarea. Este es un problema del mundo real en el que estoy interesado. En parte porque me interesan las estadísticas y el mal uso de las estadísticas, y en parte porque no me gusta la persecución de rapaces. Es mi primera publicación en el área de estadísticas de intercambio de pila, así que si es inapropiado, me disculpo
Colin
55
¡Nada inapropiado! Simplemente recibimos a muchas personas que pegan su tarea y parecen esperar que la respondamos por ellos, por lo que hay cierta sensibilidad al respecto. Pero como una pregunta REAL, esto definitivamente es un tema.
jbowman
2
Si no le importa, deje la tabla de tiempos. Agrega desafíos interesantes a la pregunta. ¿Sabes en qué años se perdieron las etiquetas? Idealmente, podríamos conectar el adjunto, el destino y el tipo correspondientes para cada etiqueta.
gung - Restablece a Monica
1
A su pregunta: "¿Se puede hacer una copia de seguridad de la declaración?" Yo respondería que sí, puede. Sin embargo, la relación no es causal, hay factores de confusión obvios como la edad de los dispositivos que no se pueden controlar. Para cualquier afirmación "es obvio ver tal y tal relación causal", uno no necesita responder con una inferencia causal adecuada que muestre la conclusión opuesta. Uno simplemente debe encontrar una variable de confusión que amenace la identificación de esta relación causal. Ahora, si su objetivo es realizar una inferencia causal adecuada, esa es una historia diferente.
dv_bn

Respuestas:

0

Encontré una manera de llegar a mi respuesta de este comentario " busque la distribución hipergeométrica " en math.stackexchange:

De la entrada de Wikipedia sobre distribución hipergeométrica

En teoría y estadística de probabilidad, la distribución hipergeométrica es una distribución de probabilidad discreta que describe la probabilidad de k éxitos (sorteos aleatorios para los cuales el objeto dibujado tiene una característica específica) en n sorteos, sin reemplazo.

Luego, usando una calculadora hipergeométrica en línea y las siguientes cifras:

Población: 135

Número de éxitos en población: 42

Tamaño de muestra: 17

Número de éxitos en la muestra: 8

Encuentro que la probabilidad de obtener exactamente 8 es 0.0703, y la probabilidad de obtener 8 o más es 0.1095

Creo que la cifra de "8 o más" es la relevante en este caso, y tengo que decir que esta probabilidad es menor de lo previsto por mi intuición.

Por lo tanto, los números sugieren que hay un 89% de probabilidad de que haya algo diferente en la tasa de falla cuando se segrega por tipo de etiqueta. Eso no significa que la causa de la diferencia sea el tipo de etiqueta.

Colin
fuente
1
Esto no controla la antigüedad de las etiquetas, lo que crea dudas sobre el significado o la utilidad de la probabilidad.
whuber
@whuber tenemos un "científico" que afirma que "ciertas etiquetas tienen pérdidas porcentuales mucho más altas (80NS al 47%) [...] si vamos por etiqueta, implica que podría haber etiquetas y arneses más propensos a fallas desconocidas que el descanso ", así que lo primero que quería saber era cuál era la probabilidad de obtener una tasa de falla del 47% si asumíamos que todas las etiquetas tenían la misma tasa de falla.
Colin
@whuber En realidad, el argumento probablemente sea discutible porque si lees el informe original, el 80NS se ignora en gran medida en la discusión sobre la confiabilidad de la etiqueta y el caso para afirmar que los resultados de "detención sin mal funcionamiento" se deben principalmente a la persecución se basa principalmente en el evidencia de las etiquetas 70GPS / GSM. El modelo 80NS solo se implementó en los primeros años, se dice que es menos confiable y usó un diseño de arnés con más probabilidades de caerse prematuramente.
Colin