Estoy interesado en aprender cómo desarrollar una aproximación geográfica de algún tipo de epicentro basado en los datos del brote de cólera John Snow. Qué modelo estadístico podría usarse para resolver un problema de este tipo sin un conocimiento previo de dónde están ubicados los pozos.
Como problema general, tendría a su disposición el tiempo, la ubicación de los puntos conocidos y el sendero del observador. El método que estoy buscando usaría estas tres cosas para estimar el epicentro del "brote".
bayesian
spatial
epidemiology
gis
Cylondude
fuente
fuente
Respuestas:
No para dar una respuesta completa o autorizada, sino solo para estimular ideas, informaré sobre un análisis rápido que hice para un ejercicio de laboratorio en un curso de estadísticas espaciales que estaba enseñando hace diez años. El propósito era ver qué efecto tendría una contabilidad precisa de las posibles rutas de viaje (a pie), en comparación con el uso de distancias euclidianas, en un método exploratorio relativamente simple: una estimación de la densidad del grano. ¿Dónde estaría el pico (o picos) de la densidad en relación con la bomba cuyo mango quitó Snow?
Utilizando una representación ráster de bastante alta resolución (2946 filas por 3160 columnas) del mapa de Snow (correctamente georreferenciado), digitalicé cada uno de los cientos de pequeños ataúdes negros que se muestran en el mapa (encontrando 558 de ellos en 309 direcciones), asignándolos a el borde de la calle correspondiente a su dirección, y resumiendo por dirección en un recuento en cada ubicación.
Después de un procesamiento de imágenes para identificar las calles y callejones, realicé una difusión gaussiana simple limitada a esas áreas (utilizando medios focales repetidos en un SIG). Este es el KDE.
El resultado habla por sí mismo: apenas necesita una leyenda para explicarlo. (El mapa muestra muchas otras bombas, pero todas se encuentran fuera de esta vista, que se centra en las áreas de mayor densidad).
fuente
En [1, §3.2], David Freedman sugiere una respuesta esencialmente negativa a su pregunta. Es decir, ningún (mero) modelo estadístico o algoritmo podría resolver el problema de John Snow. El problema de Snow era desarrollar un argumento crítico que apoyara su teoría de que el cólera es una enfermedad infecciosa transmitida por el agua, contra la teoría del miasma prevaleciente de su época. (El Capítulo 3 en [1], titulado “Modelos estadísticos y cuero de calzado” también está disponible en forma publicada anteriormente [2] aquí ).
En estas pocas páginas cortas [1, pp.47–53], gran parte de las cuales es una cita extendida del propio John Snow, Freedman argumenta que "lo que Snow realmente hizo en 1853-1854 es aún más interesante que la fábula [de The Broad Street Pump] ". En cuanto a la clasificación de la evidencia estadística (se discuten otros preliminares como la identificación de casos índice, etc.), Snow explotó la variación natural para efectuar un cuasi-experimento verdaderamente notable.
Resulta que en un momento anterior, había una fuerte competencia entre las compañías de suministro de agua en Londres, y esto resultó en una mezcla espacial del suministro de agua que era (en palabras de Snow) "del tipo más íntimo".
Otro poco de importancia crítica de la 'variación natural', John Snow, explotado en este cuasi-experimento fue que una compañía de agua tuvo su consumo de agua en el Támesis aguas abajo de las descargas de aguas residuales , mientras que el otro tenía unos pocos años antes trasladó su ingesta de aguas arriba . ¡Te dejaré adivinar cuál era cuál de la tabla de datos de John Snow!
Como Freedman señala, fulminante,
Otro punto de variación natural explotado por Snow ocurrió en la dimensión del tiempo : la reubicación de la toma de agua mencionada anteriormente ocurrió entre dos epidemias, lo que permitió a Snow comparar el agua de la misma compañía con y sin alcantarillado adicional. (Gracias a Philip B. Stark, un autor de [1], por esta información a través de Twitter . Vea esta conferencia en línea suya).
Este asunto también proporciona un estudio instructivo en el contraste entre deductivismo e inductivismo , como se discute en esta respuesta .
Freedman D, Collier D, Sekhon JS, Stark PB. Modelos estadísticos e inferencia causal: un diálogo con las ciencias sociales. Cambridge; Nueva York: Cambridge University Press; 2010
Freedman DA. Modelos estadísticos y calzado de cuero. Metodología Sociológica . 1991; 21: 291-313. doi: 10.2307 / 270939. Texto completo
fuente