Al hacer coincidir pacientes con base en datos demográficos, ¿hay alguna recomendación sobre qué campos deben coincidir para que el paciente sea el "mismo paciente"?
Sé que los algoritmos serán diferentes para diferentes implementaciones, solo tengo curiosidad por saber si hay mejores prácticas o recomendaciones en torno a este proceso.
First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip
etc?
Respuestas:
Existe este gran ensayo (en español, lo siento) escrito por Pablo Pazos, un ingeniero de CS de Uruguay que ha estado trabajando en TI para el cuidado de la salud desde 2006 y ha hecho grandes contribuciones al campo, en el que describe un algoritmo para hacerlo.
Puede publicar el artículo a través de un traductor, pero lo esencial es que la información básica para determinar la identidad de una persona son sus nombres y apellidos (tanto del padre como de la madre), el sexo y la fecha de nacimiento. Curiosamente, excluye específicamente los números de identificación como el SSN de sus algoritmos de coincidencia de identidad, ya que "cualquier tipo de identificador NO es parte de su identidad" (aunque supongo que este punto podría ser discutible). Además, excluye atributos como la dirección, los números de teléfono, etc., ya que no están realmente relacionados con la identidad de alguien, no están asociados con "quién es realmente alguien".
Además, asigna diferentes "pesos" a cada uno de los atributos anteriores, como este:
Con las coincidencias encontradas en cada uno de estos atributos, describe una metodología para obtener un "índice de concordancia de concordancia" compuesto con el cual las comparaciones entre registros pueden ser posibles. Además, las coincidencias "parciales" en los atributos de nombre son posibles mediante el uso de algoritmos como la distancia de Levenshtein .
Buena lectura, OMI. Lo siento, está en español, pero espero haber podido transmitir sus ideas principales.
fuente
No existe un algoritmo mágico único para la correspondencia de pacientes, y dudo que alguna vez lo haya.
Para empezar, hay variaciones regionales. Como señaló MMattoli, lo que funciona bien en un hospital urbano de los Estados Unidos probablemente no encajará bien en una clínica rural australiana que trata a los aborígenes.
Además, los sitios individuales tienen diferentes puntos de vista sobre la tolerancia a fallas. Si solo igualaras cuando estuvieras absolutamente seguro , obtendrías muchos partidos perdidos. Esto provoca registros de pacientes duplicados, lo que crea un conjunto de problemas completamente diferente. La mayoría de los sitios estarán dispuestos a conformarse con bastante seguridad , pero ¿qué tan seguro es lo suficientemente seguro? Pregunta a 10 personas y obtendrás 12 respuestas.
Por lo tanto, el "mejor" algoritmo será configurable, para que sus clientes puedan ajustarlo a sus necesidades.
Al considerar un partido, los diferentes campos ofrecen diversos grados de confianza.
Los identificadores específicos de la atención médica ofrecen la mayor confianza, ya que su único propósito es identificar de manera única a la persona dentro del sistema de salud. Los hospitales generalmente se esfuerzan para asegurarse de que no se dupliquen.
Ejemplos:
Otros identificadores de pacientes también pueden ofrecer una gran confianza, dependiendo del sistema. Por ejemplo, una identificación militar es probablemente muy relevante en un hospital militar.
Ejemplos:
En ausencia de identificadores únicos, uno debe recurrir a la información demográfica. Es poco aconsejable para que coincida en cualquier uno de campo, pero el partido campo más demográfica, más confianza el partido.
Las cosas sobre una persona que a menudo no cambian son buenas para emparejar:
Pero se puede considerar aún más información maleable en el partido para aumentar la confianza:
fuente
También vale la pena consultar los apellidos anteriores, ya que estos a menudo cambian.
fuente
Además de las combinaciones obvias de los siguientes tres que figuran en su pregunta
Pensaría en agregar
phone number (Home and/or Cell)
a la lista. En estos días es bastante común y cada uno tendrá un número único e incluso si algunas veces las personas cambian sus números de teléfono, la mayoría de la gente recuerda los números de teléfono más antiguos, por lo que puede ser útil.Descubrimos que la dirección a menudo sufre de múltiples deletreos y múltiples formas de representación, especialmente en países como India, donde las personas usan un idioma local y los softwares de gestión de pacientes 'aún' usan el inglés.
fuente
El género en los registros parece derivarse a menudo del Nombre. He visto una mayor variación en el género para los extranjeros, cuando no podemos derivar el género del nombre.
En Alemania tenemos algunas variaciones adicionales con nombres que contienen 'Umlaute' como 'äöü', que a veces se reemplazan por 'ae oe ue'.
fuente
Mi pensamiento está en el orden de abajo 1). SSN, apellido y primeros 5 caracteres del primer nombre 2). SSN, fecha de nacimiento y los primeros 5 caracteres del primer nombre 3). SSN, fecha de nacimiento y apellido 4). SSN, Sexo, Fecha de nacimiento 5). Apellido, primeros 5 caracteres de nombre, ciudad y código postal
fuente
Este es un problema realmente difícil en los Estados Unidos. Los nombres no son únicos y a menudo cambian durante la vida de una persona o se presentan de manera diferente (Rob versus Robert, por ejemplo), por lo que nunca se pueden usar para identificar al paciente, excepto en combinación con alguna información más confiable. El número de seguro médico y el proveedor cambian con mucha más frecuencia y pueden ser los mismos para varios miembros de la familia. El SSN es supuestamente único, pero hay fraude a su alrededor. Lo mismo con el número de licencia del conductor que, por supuesto, no todos tendrán.
Personalmente, comenzaría con la combinación de número de póliza de seguro y fecha de nacimiento y nombre, luego SSN y combinación de fecha de nacimiento y nombre. Verificaría la dirección y el teléfono para darme seguridad adicional cuando coinciden, pero no mucho peso si no lo hacen. Además, usaría el tipo de sangre como un factor de descarte si se conoce (y todos sabemos que los vampiros del hospital tomarán muestras de sangre) ya que eso no cambia. La coincidencia de nombres tendría que ser difusa debido al problema de variación de nombre. Otras cosas generalmente deberían buscar una coincidencia exacta primero, una coincidencia difusa si la confianza del nombre es realmente alta (podría haber sido un error tipográfico ingresando al SSN).
fuente