// Codificación de nombres del censo de Statistics Canada para enlace de registros
Utilizado por Statistics Canada para datos de censos.
Códigos coherentes de 4 caracteres para todos los nombres.
Gestiona correctamente los caracteres acentuados en francés.
El algoritmo de codificación de nombres de Statistics Canada se utiliza para el enlace de registros en datos de censos y estadísticas vitales. Genera un código de 4 caracteres a partir del apellido y, opcionalmente, del nombre. El algoritmo toma la primera letra del apellido más las siguientes dos consonantes (se eliminan las vocales y la letra Y). Si el apellido proporciona menos de 3 caracteres utilizables, se usa la primera letra del nombre. El código maneja correctamente los caracteres franceses acentuados convirtiéndolos en sus formas básicas.
Pasos del algoritmo: 1. Primera letra del apellido 2. Siguientes 2 consonantes del apellido 3. Inicial del nombre si es necesario 4. Rellenar con espacios hasta 4 caracteres Ejemplos: SMITH → SMTH S + M + T + H MacDONALD → MCDL M + C + D + (N L) Tremblay, Marie → TRMB T + R + M + B Lee, David → LEED L + (sin consonantes) + D Tratamiento del francés: Côté → COTE → CT Lépine → LEPINE → LPN Nombres cortos: Lo → LO (rellenado) Kim, Su → KMS
La codificación de nombres de Statistics Canada es un algoritmo utilizado por el gobierno canadiense para el enlace de registros en datos de censos y estadísticas vitales. Crea un código estandarizado de 4 caracteres a partir de los nombres para facilitar la coincidencia de registros entre diferentes bases de datos.
El algoritmo convierte automáticamente los caracteres franceses acentuados (é, è, ê, ç, etc.) a sus formas básicas antes de procesarlos. Esto garantiza códigos coherentes independientemente de si se utilizan acentos en los datos originales.
El nombre de pila solo se utiliza cuando el apellido no proporciona suficientes caracteres para el código. Si el apellido tiene menos de 3 caracteres utilizables después de eliminar las vocales, se añade la primera letra del nombre al código.
A diferencia de algoritmos fonéticos como Soundex o Metaphone, la codificación de Statistics Canada no es estrictamente fonética. Es un algoritmo sencillo de extracción de caracteres diseñado para la consistencia y la facilidad de implementación en sistemas gubernamentales, especialmente adaptado a los patrones de nombres canadienses.