Statistics Canada namnkodning | Kodning av folkbokföringsnamn

>> funktioner

[CENSUS]

Officiell algoritm

Används av Statistics Canada för folkräkningsdata.

[4-CHAR]

Fast längd

Enhetliga 4‑teckenskoder för alla namn.

[BILINGUAL]

Stöd för franska

Hanterar franska tecken med accenter på rätt sätt.

>> teknisk information

Hur Statistics Canada‑kodning fungerar

Statistics Canadas namnkodningsalgoritm används för att sammanlänka register i folkräkningsdata och vitalstatistik. Den skapar en 4‑teckenskod från efternamn och vid behov förnamn. Algoritmen tar den första bokstaven i efternamnet plus de två nästa konsonanterna (vokaler och bokstaven Y tas bort). Om efternamnet ger färre än 3 användbara tecken används första bokstaven i förnamnet. Koden hanterar franska tecken med accenter genom att konvertera dem till deras grundformer.

Exempel på kodning av folkbokföringsnamn

Algoritmens steg:
1. Första bokstaven i efternamnet
2. Nästa 2 konsonanter från efternamnet
3. Initial i förnamnet vid behov
4. Fyll ut med blanksteg till 4 tecken

Exempel:
SMITH → SMTH
  S + M + T + H

MacDONALD → MCDL
  M + C + D + (N L)

Tremblay, Marie → TRMB
  T + R + M + B

Lee, David → LEED
  L + (inga konsonanter) + D

Hantering av franska:
Côté → COTE → CT  
Lépine → LEPINE → LPN 

Korta namn:
Lo → LO   (utfyllt)
Kim, Su → KMS

Varför använda Statistics Canada‑kodning

> Officiell kanadensisk folkräkningsmetodik
> Sammanlänkning av register i myndighetsdatabaser
> Matchning av vitalstatistik
> Tvåspråkigt stöd för franska och engelska
> Enkelt och konsekvent 4‑teckensformat

>> vanliga frågor

Vad är Statistics Canada namnkodning?

Statistics Canada namnkodning är en algoritm som används av den kanadensiska regeringen för att sammanlänka register i folkräkningsdata och vitalstatistik. Den skapar en standardiserad 4‑teckenskod från namn för att underlätta matchning av poster mellan olika databaser.

Hur hanteras franska namn?

Algoritmen konverterar automatiskt franska tecken med accenter (é, è, ê, ç osv.) till deras grundformer innan de bearbetas. Detta ger konsekventa koder oavsett om accenter finns i originaldata eller inte.

När används förnamnet?

Förnamnet används bara när efternamnet inte ger tillräckligt många tecken för koden. Om efternamnet har färre än 3 användbara tecken efter att vokaler tagits bort läggs den första bokstaven i förnamnet till koden.

Hur skiljer detta sig från andra fonetiska algoritmer?

Till skillnad från fonetiska algoritmer som Soundex eller Metaphone är Statistics Canada‑kodning inte strikt fonetisk. Det är en enkel teckenextraktionsalgoritm som är utformad för konsekvens och enkel implementering i myndighetssystem, särskilt anpassad för kanadensiska namnmönster.

> statistics | canada | coding <

> Analysis