// Statistics Canada navnekoding for kobling av registre
Brukes av Statistics Canada for folketellingsdata.
Like koder på 4 tegn for alle navn.
Håndterer franske bokstaver med aksent på riktig måte.
Navnekodingsalgoritmen til Statistics Canada brukes til kobling av registre i folketellingsdata og vitale statistikker. Den lager en kode med 4 tegn fra etternavn og eventuelt fornavn. Algoritmen tar den første bokstaven i etternavnet og de neste to konsonantene (vokaler og bokstaven Y fjernes). Hvis etternavnet gir færre enn 3 brukbare tegn, brukes den første bokstaven i fornavnet. Koden håndterer franske bokstaver med aksent ved å konvertere dem til grunnformene.
Algoritmens trinn: 1. Første bokstav i etternavnet 2. De neste 2 konsonantene fra etternavnet 3. Forbokstav i fornavnet ved behov 4. Fyll med mellomrom til 4 tegn Eksempler: SMITH → SMTH S + M + T + H MacDONALD → MCDL M + C + D + (N L) Tremblay, Marie → TRMB T + R + M + B Lee, David → LEED L + (ingen konsonanter) + D Behandling av fransk: Côté → COTE → CT Lépine → LEPINE → LPN Korte navn: Lo → LO (utfylt) Kim, Su → KMS
Statistics Canada navnekoding er en algoritme som brukes av den kanadiske regjeringen til å koble registre i folketellingsdata og vitale statistikker. Den lager en standardisert kode med 4 tegn fra navn for å gjøre det enklere å matche registre på tvers av databaser.
Algoritmen konverterer franske bokstaver med aksent (é, è, ê, ç osv.) automatisk til grunnformene sine før behandling. Dette gir konsistente koder uansett om aksenter er oppgitt i de opprinnelige dataene eller ikke.
Fornavnet brukes bare når etternavnet ikke gir nok tegn til koden. Hvis etternavnet har færre enn 3 brukbare tegn etter at vokaler er fjernet, legges den første bokstaven i fornavnet til koden.
I motsetning til fonetiske algoritmer som Soundex eller Metaphone er Statistics Canada‑koding ikke strengt fonetisk. Det er en enkel tegnekstraksjonsalgoritme som er designet for konsistens og enkel implementering i offentlige systemer, spesielt tilpasset kanadiske navnemønstre.