// Statistics Canada navnekodning for sammenkædning af registre
Bruges af Statistics Canada til folketællingsdata.
Ensartede koder på 4 tegn for alle navne.
Håndterer franske bogstaver med accenter korrekt.
Statistics Canadas navnekodningsalgoritme bruges til sammenkædning af registre i folketællingsdata og vitale statistikker. Den opretter en kode på 4 tegn ud fra efternavne og eventuelt fornavne. Algoritmen tager det første bogstav i efternavnet plus de næste to konsonanter (vokaler og Y fjernes). Hvis efternavnet giver færre end 3 brugbare tegn, bruges det første bogstav i fornavnet. Koden håndterer franske bogstaver med accenter ved at konvertere dem til deres grundformer.
Algoritmens trin: 1. Første bogstav i efternavnet 2. De næste 2 konsonanter fra efternavnet 3. Forbogstavet i fornavnet om nødvendigt 4. Udfyld med mellemrum til 4 tegn Eksempler: SMITH → SMTH S + M + T + H MacDONALD → MCDL M + C + D + (N L) Tremblay, Marie → TRMB T + R + M + B Lee, David → LEED L + (ingen konsonanter) + D Fransk håndtering: Côté → COTE → CT Lépine → LEPINE → LPN Korte navne: Lo → LO (udfyldt) Kim, Su → KMS
Statistics Canada navnekodning er en algoritme, som den canadiske regering bruger til sammenkædning af registre i folketællingsdata og vitale statistikker. Den opretter en standardiseret kode på 4 tegn ud fra navne for at gøre det lettere at matche poster på tværs af databaser.
Algoritmen konverterer automatisk franske bogstaver med accenter (é, è, ê, ç osv.) til deres grundformer, før de behandles. Det sikrer ensartede koder, uanset om accenter er angivet i de oprindelige data eller ej.
Fornavnet bruges kun, når efternavnet ikke giver nok tegn til koden. Hvis efternavnet har færre end 3 brugbare tegn efter fjernelse af vokaler, tilføjes det første bogstav i fornavnet til koden.
I modsætning til fonetiske algoritmer som Soundex eller Metaphone er Statistics Canada-kodning ikke strengt fonetisk. Det er en enkel tegnudtræksalgoritme, der er designet til konsistens og nem implementering i offentlige systemer, særligt tilpasset canadiske navnemønstre.