Gobierno de información relacionada con SIG [cerrado]

22

A menudo trabajo en el mapeo de datos sensibles a nivel de paciente. Si bien siento que tengo una buena comprensión de muchos de los problemas de gobernanza en torno a esto (es decir, cuándo usar las técnicas de binning y k-anonimato ), pero me gustaría mejorar mi conocimiento sobre esto.

Aquí hay un buen ejemplo de por qué esto es importante: confidencialidad espacial y SIG: reingeniería de ubicaciones de mortalidad a partir de mapas publicados sobre el huracán Katrina

¿Alguien tiene alguna buena regla general que empleen al mapear datos confidenciales?

¿Existe algún buen recurso que cubra diferentes métodos para proteger la confidencialidad o brinde orientación sobre el tema?

Caer
fuente
2
+1 (Por cierto, un método de anonimato de datos sugerido en un hilo anterior aparece en gis.stackexchange.com/questions/31236/… ) ¿Podría aclarar lo que quiere decir con "reglas generales "? ¿Busca soluciones técnicas para ocultar detalles de datos o busca orientación sobre cuándo y en qué medida deben protegerse los datos?
whuber
1
Principalmente soluciones técnicas, aunque la orientación sobre el nivel de protección también sería útil. Veo que estos van de la mano. Por ejemplo, los datos muy sensibles que consisten en muchos números pequeños deben mostrarse utilizando la técnica X o la técnica Y si se incluye información demográfica. Estaba considerando usar el agrupamiento hexadecimal para una tarea, pero de repente pensé que no tenía idea de la población en cada hexágono. ¿Qué pasa si exhibí un valor de 20 y luego descubrí que solo había 20 residentes dentro de ese hexágono? También escuché recientemente sobre el problema de la unidad aérea modificable relacionado con esto.
Tumbledown
He votado para cerrar esto como demasiado amplio porque busca tanto una lista de "reglas generales" como una lista de recursos.
PolyGeo

Respuestas:

8

Esta discusión es muy necesaria en la profesión de SIG, y culpo mucho a la educación superior por descuidar este tema.

Dicho esto, aquí hay algunos interesantes, si no obsoletos, literatura sobre el tema. El único consenso real entre estos recursos es que no hay consenso en la profesión de SIG con respecto a la privacidad personal, pero debería ser una preocupación importante.

Ética de los SIG | Jeremy Crampton

Protección de la privacidad personal en el uso de sistemas de información geográfica | Harlan J. Onsrud, Jeff P. Johnson y Xavier Lopez | ENLACE ACTUALIZADO 11/01/17

Privacidad y confidencialidad en salud SIG | ENLACE ACTUALIZADO 11/01/17

Sean Adkins
fuente
1
Voté esto como algo que realmente subraya la dificultad inherente (aún) en esta área. Pickles realmente (y a propósito) abrió una lata tan grande de gusanos con sus observaciones que es casi imposible abordar cada posible acto de no divulgación. Siempre existe el espinoso problema del conocimiento contextual que influye en un reclamo de divulgación, así como el conocimiento aplicado desde fuera del recurso original que puede usarse para identificar a un individuo. El hashing de datos o los puntos de compensación espacial nunca pueden negar tales problemas potenciales. ¡Así que te quedas con tu propia postura ética!
Andrew Tice
Los procedimientos estándar de anonimato tienden a hacer suposiciones sobre poblaciones normalmente distribuidas, cuando la mayoría de los análisis espaciales tienden a estar lejos de ser distribuidos normalmente. La creación de ráster va un poco al difuminar la precisión percibida de los resultados, por lo que podría considerarse para una presentación general. La pregunta original mencionaba el MAUP, y ciertamente usar alguna forma de estafa en diferentes niveles espaciales podría ayudar, aunque al final podría valer la pena desempolvar algo como el GAM de Openshaw.
Andrew Tice
1
@ AndrewTice ¿Puedo preguntar qué es la estafa? ¡Mis habilidades de eliminación de acrónimos me han abandonado hoy!
Tumbledown
1
@Tumbledown - ¡Lo siento! Es sinónimo de método de ajuste de celda pequeña. Si lo busca en Google en su totalidad, encontrará literatura de la ONS en el Reino Unido. Es uno de los métodos probados para los informes de censo de pequeño nivel, por lo que se aplica para el recuento de unidades de área. Es un poco fuerza bruta, pero dado que el ONS lo ha usado ampliamente, hay un poco de justificación para aplicar el método.
Andrew Tice
1
¡Ay! Siempre es un fastidio cuando se hace referencia a material antiguo. Trataré de encontrar enlaces de trabajo y editar mi publicación adecuadamente. ¡Gracias!
Sean Adkins el
4

Estas son las reglas dadas por Eurostat cuando solicita informar las ubicaciones de las explotaciones. Las ubicaciones se informan con coordenadas redondeadas y, en ciertos casos, aplicando un desplazamiento semi-aleatorio adicional. No sé si dan una buena regla general, pero al menos estas reglas son utilizadas por una autoridad europea conocida.

En cuanto a la ubicación de la explotación, se aplican dos principios: (i) no se requieren coordenadas precisas; y (ii) se recodificará una ubicación con solo una participación.

(i) no se requieren coordenadas precisas: las coordenadas de longitud y latitud no se requerirán en términos de segundos o fracciones decimales de minutos. Será necesario proporcionar la ubicación solo a los 5 minutos más cercanos, que representan un área de tierra de aproximadamente 3,000-7,000 ha, dependiendo de la ubicación en Europa.

ii) se recodificará una ubicación con una sola explotación: es posible que en áreas con explotaciones muy grandes, la ubicación especificada a los 5 minutos de longitud y latitud más cercanos pueda contener solo una explotación que, por lo tanto, sea directamente identificable. Para garantizar que no se pueda llevar a cabo una identificación directa, la localidad con una sola explotación debe asignarse al punto vecino más cercano (elegido al azar) con al menos otra explotación. Si alguna de las 8 ubicaciones vecinas no tiene al menos una explotación, las ubicaciones vecinas deben extenderse hasta que otras se encuentren con al menos otra explotación. Sin embargo, siempre que sea posible, la explotación agrícola debe asignarse a la región NUTS 3 donde está situada.

usuario30184
fuente
1

Pensé poner este sitio útil como un enlace adicional: UK Anonymisation Network

No es específico de SIG y está dirigido al Reino Unido, pero brinda información y recursos útiles para mitigar el riesgo de divulgación.

También organizan una serie de talleres y clínicas de anonimización gratuitas.

Caer
fuente
Otro enlace útil, un marco de toma de decisiones de UKAN: ukanon.net/ukan-resources/ukan-decision-making-framework
Tumbledown