> statistics | canada | coding <
// Statistics Canada namnkodning för sammanlänkning av register
>> funktioner
Officiell algoritm
Används av Statistics Canada för folkräkningsdata.
Fast längd
Enhetliga 4‑teckenskoder för alla namn.
Stöd för franska
Hanterar franska tecken med accenter på rätt sätt.
>> teknisk information
Hur Statistics Canada‑kodning fungerar
Statistics Canadas namnkodningsalgoritm används för att sammanlänka register i folkräkningsdata och vitalstatistik. Den skapar en 4‑teckenskod från efternamn och vid behov förnamn. Algoritmen tar den första bokstaven i efternamnet plus de två nästa konsonanterna (vokaler och bokstaven Y tas bort). Om efternamnet ger färre än 3 användbara tecken används första bokstaven i förnamnet. Koden hanterar franska tecken med accenter genom att konvertera dem till deras grundformer.
Exempel på kodning av folkbokföringsnamn
Algoritmens steg: 1. Första bokstaven i efternamnet 2. Nästa 2 konsonanter från efternamnet 3. Initial i förnamnet vid behov 4. Fyll ut med blanksteg till 4 tecken Exempel: SMITH → SMTH S + M + T + H MacDONALD → MCDL M + C + D + (N L) Tremblay, Marie → TRMB T + R + M + B Lee, David → LEED L + (inga konsonanter) + D Hantering av franska: Côté → COTE → CT Lépine → LEPINE → LPN Korta namn: Lo → LO (utfyllt) Kim, Su → KMS
Varför använda Statistics Canada‑kodning
- > Officiell kanadensisk folkräkningsmetodik
- > Sammanlänkning av register i myndighetsdatabaser
- > Matchning av vitalstatistik
- > Tvåspråkigt stöd för franska och engelska
- > Enkelt och konsekvent 4‑teckensformat
>> vanliga frågor
Vad är Statistics Canada namnkodning?
Statistics Canada namnkodning är en algoritm som används av den kanadensiska regeringen för att sammanlänka register i folkräkningsdata och vitalstatistik. Den skapar en standardiserad 4‑teckenskod från namn för att underlätta matchning av poster mellan olika databaser.
Hur hanteras franska namn?
Algoritmen konverterar automatiskt franska tecken med accenter (é, è, ê, ç osv.) till deras grundformer innan de bearbetas. Detta ger konsekventa koder oavsett om accenter finns i originaldata eller inte.
När används förnamnet?
Förnamnet används bara när efternamnet inte ger tillräckligt många tecken för koden. Om efternamnet har färre än 3 användbara tecken efter att vokaler tagits bort läggs den första bokstaven i förnamnet till koden.
Hur skiljer detta sig från andra fonetiska algoritmer?
Till skillnad från fonetiska algoritmer som Soundex eller Metaphone är Statistics Canada‑kodning inte strikt fonetisk. Det är en enkel teckenextraktionsalgoritm som är utformad för konsekvens och enkel implementering i myndighetssystem, särskilt anpassad för kanadensiska namnmönster.