// NYSIIS - codifica fonetica ad alta precisione per il confronto e la deduplicazione dei nomi
Più preciso di Soundex nella maggior parte degli scenari di confronto dei nomi.
Genera codici fonetici coerenti a lunghezza fissa facili da confrontare.
Utilizzato nei sistemi di giustizia penale e in vari registri governativi dello Stato di New York.
NYSIIS (New York State Identification and Intelligence System) è un algoritmo di codifica fonetica sviluppato negli anni '70 per migliorare il confronto dei cognomi. Rispetto a Soundex applica regole più articolate per prefissi, suffissi e combinazioni di lettere frequenti. Il nome viene trasformato progressivamente in un codice fonetico di 6 caratteri, adatto alla deduplicazione e al collegamento dei record.
Trasformazioni di nomi:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
Casi speciali:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
Regole chiave:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- Vocali → A
NYSIIS è un algoritmo di codifica fonetica che rappresenta i nomi in base alla pronuncia anziché all'ortografia. È stato creato per il sistema giudiziario dello Stato di New York per individuare cognomi che suonano uguali anche se scritti in modo diverso.
In molti casi NYSIIS è più accurato di Soundex. Copre più casi limite, gestisce meglio le varianti dei cognomi e produce codici alfanumerici di 6 caratteri invece di 4.
Il NYSIIS modificato è una variante migliorata che aggiunge e affina alcune regole, in particolare per le vocali e per certi gruppi consonantici, così da ottenere match più affidabili.
Viene utilizzato nei sistemi giudiziari, nei registri sanitari, nelle banche dati genealogiche e nelle piattaforme CRM, ovunque sia necessario raggruppare nomi che suonano in modo simile.