// NYSIIS - høy-presis fonetisk koding for navnematching og dublettkontroll
Mer presis enn Soundex i de fleste scenarier for navnematching.
Genererer konsistente fonetiske koder på seks tegn som er enkle å sammenligne.
Brukes i retts- og offentlige systemer i delstaten New York.
NYSIIS (New York State Identification and Intelligence System) er en fonetisk kodingsalgoritme utviklet på 1970-tallet for å forbedre navnematching. Den går lenger enn Soundex ved å bruke flere regler for vanlige prefiks, suffiks og bokstavmønstre. Navn transformeres stegvis til en fonetisk kode på seks tegn som egner seg for dublettkontroll og kobling av registre.
Navntransformasjoner:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
Spesialtilfeller:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
Viktige regler:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- Vokaler → A
NYSIIS er en fonetisk kodingsalgoritme som representerer navn etter uttale i stedet for stavemåte. Den ble utviklet for rettssystemet i delstaten New York for å finne etternavn som høres like ut, selv om de staves forskjellig.
I praksis gir NYSIIS ofte bedre presisjon enn Soundex. Algoritmen håndterer flere spesialtilfeller og gir 6-tegnskoder i stedet for 4, noe som reduserer både falske treff og manglende treff.
Modifisert NYSIIS er en forbedret variant som finjusterer enkelte regler, blant annet for vokaler og konsonantgrupper, for å gi mer stabile matcher for visse navn.
Algoritmen brukes i retts- og politiregistre, helsesystemer, slektsdatabaser og CRM-løsninger der man vil gruppere navn som høres like ut.