// NYSIIS – hochpräzise phonetische Kodierung für Namensabgleich und Dublettenerkennung
Präziser als Soundex für allgemeinen Namensabgleich in großen Datenbeständen.
Erzeugt konsistente phonetische Codes mit fester Länge von sechs Zeichen.
Eingesetzt im Justizsystem des Bundesstaats New York und in anderen öffentlichen Systemen.
NYSIIS (New York State Identification and Intelligence System) ist ein phonetischer Kodierungsalgorithmus aus den 1970er-Jahren, der zur Verbesserung von Namensabgleichen entwickelt wurde. Im Gegensatz zu Soundex verwendet NYSIIS umfangreichere Regeln für häufige Präfixe, Suffixe und Buchstabenkombinationen in Nachnamen. Namen werden schrittweise in einen 6-stelligen phonetischen Code überführt, der sich gut für Dublettenerkennung und Record-Linkage eignet.
Namenstransformationen:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
Spezialfälle:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
Zentrale Regeln:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- Vokale → A
NYSIIS ist ein phonetischer Kodierungsalgorithmus, der Namen nach ihrer Aussprache statt ihrer Schreibweise abbildet. Er wurde ursprünglich für das Justizsystem des Bundesstaats New York entwickelt, um ähnlich klingende Nachnamen zuverlässig zu finden.
NYSIIS erzielt in der Praxis meist eine höhere Trefferquote als Soundex. Es berücksichtigt mehr Sonderfälle, erzeugt 6-stellige Codes und reduziert damit sowohl Fehltreffer als auch übersehene Übereinstimmungen.
Modifiziertes NYSIIS ist eine erweiterte Variante, die zusätzliche Regeln für bestimmte Namensmuster einführt. Sie verbessert die Genauigkeit für einige Sprachräume und reduziert Fehlklassifikationen.
NYSIIS kommt in Justiz- und Polizeisystemen, Gesundheitsregistern, genealogischen Datenbanken und CRM-Plattformen zum Einsatz – überall dort, wo ähnlich klingende Namen konsistent abgeglichen werden müssen.