// ترميز أسماء تعداد Statistics Canada لربط السجلات
مستخدمة من قبل Statistics Canada لبيانات التعداد السكاني.
رموز ثابتة من 4 أحرف لكل الأسماء.
يتعامل بشكل صحيح مع الأحرف الفرنسية ذات العلامات.
تُستخدم خوارزمية ترميز الأسماء الخاصة بـ Statistics Canada لربط السجلات في بيانات التعداد والإحصاءات الحيوية. تنشئ الخوارزمية رمزًا من 4 أحرف من اسم العائلة، ومن الاسم الأول عند الحاجة. تأخذ الخوارزمية الحرف الأول من اسم العائلة مع الحرفين الساكنين التاليين (تُزال الحروف المتحركة وحرف Y). إذا لم يوفر اسم العائلة 3 أحرف صالحة، يُستخدم الحرف الأول من الاسم الأول. تتعامل الشيفرة مع الأحرف الفرنسية ذات العلامات من خلال تحويلها إلى أشكالها الأساسية.
خطوات الخوارزمية: 1. الحرف الأول من اسم العائلة 2. الحرفان الساكنان التاليان من اسم العائلة 3. الحرف الأول من الاسم الأول إذا لزم الأمر 4. تعبئة الفراغات حتى يصل الطول إلى 4 أحرف أمثلة: SMITH → SMTH S + M + T + H MacDONALD → MCDL M + C + D + (N L) Tremblay, Marie → TRMB T + R + M + B Lee, David → LEED L + (بدون حروف ساكنة) + D التعامل مع الفرنسية: Côté → COTE → CT Lépine → LEPINE → LPN الأسماء القصيرة: Lo → LO (مع حشو) Kim, Su → KMS
ترميز أسماء Statistics Canada هو خوارزمية تستخدمها الحكومة الكندية لربط السجلات في بيانات التعداد والإحصاءات الحيوية. تنشئ الخوارزمية رمزًا موحدًا من 4 أحرف من الأسماء لتسهيل مطابقة السجلات بين قواعد بيانات مختلفة.
تحوّل الخوارزمية تلقائيًا الأحرف الفرنسية ذات العلامات (مثل é، è، ê، ç) إلى أشكالها الأساسية قبل المعالجة. هذا يضمن رموزًا متسقة سواء كُتبت الأسماء بعلامات أو بدونها.
يُستخدم الاسم الأول فقط عندما لا يوفر اسم العائلة ما يكفي من الأحرف لتكوين الرمز. إذا بقي أقل من 3 أحرف صالحة بعد إزالة الحروف المتحركة، يضاف الحرف الأول من الاسم الأول إلى الرمز.
على عكس خوارزميات النطق مثل Soundex أو Metaphone، لا يعتمد ترميز Statistics Canada بالكامل على الصوتيات. إنه خوارزمية بسيطة لاستخلاص الأحرف مصممة للثبات وسهولة التطبيق في الأنظمة الحكومية، ومناسبة بشكل خاص لأنماط الأسماء الكندية.