// NYSIIS - zeer nauwkeurige fonetische codering voor naamsmatching en deduplicatie
Nauwkeuriger dan Soundex voor de meeste scenario's van naamsmatching.
Genereert consistente fonetische codes met vaste lengte van zes tekens.
Gebruikt in systemen voor strafrecht, gezondheidszorg en andere overheidsregisters van de staat New York.
NYSIIS (New York State Identification and Intelligence System) is een fonetisch coderingsalgoritme uit de jaren zeventig, bedoeld om naamvergelijking te verbeteren. In tegenstelling tot Soundex gebruikt het uitgebreidere regels voor veelvoorkomende voor- en achtervoegsels en lettercombinaties. Namen worden stap voor stap omgezet in een fonetische code van 6 tekens, geschikt voor deduplicatie en recordlinkage.
Naamtransformaties:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
Speciale gevallen:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
Belangrijke regels:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- Klinkers → A
NYSIIS is een fonetisch coderingsalgoritme dat namen codeert op basis van uitspraak in plaats van spelling. Het werd ontwikkeld voor het strafrechtsysteem van de staat New York om gelijk klinkende achternamen te kunnen vinden.
In de praktijk levert NYSIIS vaak betere resultaten dan Soundex. Het dekt meer randgevallen af en produceert 6-teken-codes in plaats van 4, waardoor zowel fout-positieven als fout-negatieven verminderen.
De gewijzigde NYSIIS is een verbeterde variant met extra regels voor bepaalde naamstructuren. Deze variant biedt stabielere matches voor specifieke talen en naamgroepen.
NYSIIS wordt gebruikt in justitie- en politiedatabanken, zorg- en verzekeringssystemen, genealogische databases en CRM-platformen, overal waar namen op basis van klank moeten worden vergeleken.