> nysiis | fonetisk | navn <
// NYSIIS - høy-presis fonetisk koding for navnematching og dublettkontroll
Høy nøyaktighet
Mer presis enn Soundex i de fleste scenarier for navnematching.
6-tegnskode
Genererer konsistente fonetiske koder på seks tegn som er enkle å sammenligne.
Offisiell standard
Brukes i retts- og offentlige systemer i delstaten New York.
>> teknisk informasjon
Slik fungerer NYSIIS
NYSIIS (New York State Identification and Intelligence System) er en fonetisk kodingsalgoritme utviklet på 1970-tallet for å forbedre navnematching. Den går lenger enn Soundex ved å bruke flere regler for vanlige prefiks, suffiks og bokstavmønstre. Navn transformeres stegvis til en fonetisk kode på seks tegn som egner seg for dublettkontroll og kobling av registre.
Hvorfor bruke NYSIIS?
- Matching av personer i straffesaks- og politiregistre
- Dublettkontroll i pasient- og helseregistre
- Slektshistorie og slektsforskning
- Kobling av data mellom ulike databaser
- CRM og kundesystemer med mange navnvarianter
Eksempler på NYSIIS-koding
Navntransformasjoner:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
Spesialtilfeller:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
Viktige regler:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- Vokaler → A
>> ofte stilte spørsmål
Hva er NYSIIS?
NYSIIS er en fonetisk kodingsalgoritme som representerer navn etter uttale i stedet for stavemåte. Den ble utviklet for rettssystemet i delstaten New York for å finne etternavn som høres like ut, selv om de staves forskjellig.
Hvordan sammenlignes NYSIIS med Soundex?
I praksis gir NYSIIS ofte bedre presisjon enn Soundex. Algoritmen håndterer flere spesialtilfeller og gir 6-tegnskoder i stedet for 4, noe som reduserer både falske treff og manglende treff.
Hva er modifisert NYSIIS?
Modifisert NYSIIS er en forbedret variant som finjusterer enkelte regler, blant annet for vokaler og konsonantgrupper, for å gi mer stabile matcher for visse navn.
Hvor brukes NYSIIS i dag?
Algoritmen brukes i retts- og politiregistre, helsesystemer, slektsdatabaser og CRM-løsninger der man vil gruppere navn som høres like ut.