// Statistics Canada namnkodning för sammanlänkning av register
Används av Statistics Canada för folkräkningsdata.
Enhetliga 4‑teckenskoder för alla namn.
Hanterar franska tecken med accenter på rätt sätt.
Statistics Canadas namnkodningsalgoritm används för att sammanlänka register i folkräkningsdata och vitalstatistik. Den skapar en 4‑teckenskod från efternamn och vid behov förnamn. Algoritmen tar den första bokstaven i efternamnet plus de två nästa konsonanterna (vokaler och bokstaven Y tas bort). Om efternamnet ger färre än 3 användbara tecken används första bokstaven i förnamnet. Koden hanterar franska tecken med accenter genom att konvertera dem till deras grundformer.
Algoritmens steg: 1. Första bokstaven i efternamnet 2. Nästa 2 konsonanter från efternamnet 3. Initial i förnamnet vid behov 4. Fyll ut med blanksteg till 4 tecken Exempel: SMITH → SMTH S + M + T + H MacDONALD → MCDL M + C + D + (N L) Tremblay, Marie → TRMB T + R + M + B Lee, David → LEED L + (inga konsonanter) + D Hantering av franska: Côté → COTE → CT Lépine → LEPINE → LPN Korta namn: Lo → LO (utfyllt) Kim, Su → KMS
Statistics Canada namnkodning är en algoritm som används av den kanadensiska regeringen för att sammanlänka register i folkräkningsdata och vitalstatistik. Den skapar en standardiserad 4‑teckenskod från namn för att underlätta matchning av poster mellan olika databaser.
Algoritmen konverterar automatiskt franska tecken med accenter (é, è, ê, ç osv.) till deras grundformer innan de bearbetas. Detta ger konsekventa koder oavsett om accenter finns i originaldata eller inte.
Förnamnet används bara när efternamnet inte ger tillräckligt många tecken för koden. Om efternamnet har färre än 3 användbara tecken efter att vokaler tagits bort läggs den första bokstaven i förnamnet till koden.
Till skillnad från fonetiska algoritmer som Soundex eller Metaphone är Statistics Canada‑kodning inte strikt fonetisk. Det är en enkel teckenextraktionsalgoritm som är utformad för konsekvens och enkel implementering i myndighetssystem, särskilt anpassad för kanadensiska namnmönster.