kodning | folketælling | canada

> statistics | canada | coding <

// Statistics Canada navnekodning for sammenkædning af registre

0 tegn

>> funktioner

[CENSUS]

Officiel algoritme

Bruges af Statistics Canada til folketællingsdata.

[4-CHAR]

Fast længde

Ensartede koder på 4 tegn for alle navne.

[BILINGUAL]

Fransk support

Håndterer franske bogstaver med accenter korrekt.

>> tekniske oplysninger

Sådan fungerer Statistics Canada-kodning

Statistics Canadas navnekodningsalgoritme bruges til sammenkædning af registre i folketællingsdata og vitale statistikker. Den opretter en kode på 4 tegn ud fra efternavne og eventuelt fornavne. Algoritmen tager det første bogstav i efternavnet plus de næste to konsonanter (vokaler og Y fjernes). Hvis efternavnet giver færre end 3 brugbare tegn, bruges det første bogstav i fornavnet. Koden håndterer franske bogstaver med accenter ved at konvertere dem til deres grundformer.

Eksempler på kodning af folketællingsnavne

Algoritmens trin:
1. Første bogstav i efternavnet
2. De næste 2 konsonanter fra efternavnet
3. Forbogstavet i fornavnet om nødvendigt
4. Udfyld med mellemrum til 4 tegn

Eksempler:
SMITH → SMTH
  S + M + T + H

MacDONALD → MCDL
  M + C + D + (N L)

Tremblay, Marie → TRMB
  T + R + M + B

Lee, David → LEED
  L + (ingen konsonanter) + D

Fransk håndtering:
Côté → COTE → CT  
Lépine → LEPINE → LPN 

Korte navne:
Lo → LO   (udfyldt)
Kim, Su → KMS

Hvorfor bruge Statistics Canada-kodning

  • > Officiel canadisk folketællingsmetode
  • > Sammenkædning af registre i offentlige databaser
  • > Matchning af vitale statistikker
  • > Bilingval støtte til fransk og engelsk
  • > Simpelt og ensartet format på 4 tegn

>> ofte stillede spørgsmål

Hvad er Statistics Canada navnekodning?

Statistics Canada navnekodning er en algoritme, som den canadiske regering bruger til sammenkædning af registre i folketællingsdata og vitale statistikker. Den opretter en standardiseret kode på 4 tegn ud fra navne for at gøre det lettere at matche poster på tværs af databaser.

Hvordan håndteres franske navne?

Algoritmen konverterer automatisk franske bogstaver med accenter (é, è, ê, ç osv.) til deres grundformer, før de behandles. Det sikrer ensartede koder, uanset om accenter er angivet i de oprindelige data eller ej.

Hvornår bruges fornavnet?

Fornavnet bruges kun, når efternavnet ikke giver nok tegn til koden. Hvis efternavnet har færre end 3 brugbare tegn efter fjernelse af vokaler, tilføjes det første bogstav i fornavnet til koden.

Hvordan adskiller dette sig fra andre fonetiske algoritmer?

I modsætning til fonetiske algoritmer som Soundex eller Metaphone er Statistics Canada-kodning ikke strengt fonetisk. Det er en enkel tegnudtræksalgoritme, der er designet til konsistens og nem implementering i offentlige systemer, særligt tilpasset canadiske navnemønstre.