← Back to board
VZLA_DEDUP, limpiar registros de personas desaparecidas.
Just publishedEsto es un problema conocido como Entity Resolution, la idea general es: 1. Normalización 2. Blocking: Agrupar candidatos por fonética, primeras letras, estado/ciudad. Algoritmos como Soundex o Metaphone en español. 3. Similarity scoring: para cada par candidato, calcular similitud: nombres, Coincidencia de cédula si está disponible, Edad aproximada, estado donde fue visto. 4. Clustering: Registros que superan un umbral de similitud, se marcan como probable duplicado para revisión humana. 5. Revisión humana: El algoritmo no decide solo, propone.
Medium priority
Missing personsPythonRestAPI
What this project needs
Contributors
Nothing listed
API credits
Nothing listed
Sponsors
Nothing listed