// रिकॉर्ड लिंकिंग के लिए स्टैटिस्टिक्स कनाडा जनगणना नाम कोडिंग
जनगणना डेटा के लिए Statistics Canada द्वारा उपयोग किया जाता है।
सभी नामों के लिए समान 4-अक्षर कोड।
फ्रेंच के उच्चारण चिह्न वाले अक्षरों को सही ढंग से संभालता है।
Statistics Canada नाम कोडिंग एल्गोरिदम का उपयोग जनगणना डेटा और जीवन-सांख्यिकी में रिकॉर्ड लिंकिंग के लिए किया जाता है। यह उपनाम और आवश्यकता होने पर प्रथम नाम से 4-अक्षर का कोड बनाता है। एल्गोरिदम उपनाम का पहला अक्षर और अगली दो व्यंजन लेता है (स्वरों और Y को हटा दिया जाता है)। यदि उपनाम 3 उपयोगी अक्षर नहीं देता, तो प्रथम नाम का पहला अक्षर लिया जाता है। यह कोड फ्रेंच के उच्चारण वाले अक्षरों को उनके मूल अक्षर में बदलकर संभालता है।
एल्गोरिदम के चरण: 1. उपनाम का पहला अक्षर 2. उपनाम की अगली 2 व्यंजन 3. आवश्यकता होने पर प्रथम नाम का प्रारंभिक अक्षर 4. 4 अक्षर पूरे करने के लिए रिक्त स्थान से भरें उदाहरण: SMITH → SMTH S + M + T + H MacDONALD → MCDL M + C + D + (N L) Tremblay, Marie → TRMB T + R + M + B Lee, David → LEED L + (कोई अतिरिक्त व्यंजन नहीं) + D फ्रेंच नामों का प्रबंधन: Côté → COTE → CT Lépine → LEPINE → LPN छोटे नाम: Lo → LO (पैडेड) Kim, Su → KMS
Statistics Canada नाम कोडिंग एक एल्गोरिदम है जिसका उपयोग कनाडाई सरकार जनगणना डेटा और जीवन-सांख्यिकी में रिकॉर्ड लिंकिंग के लिए करती है। यह नामों से एक मानकीकृत 4-अक्षर कोड बनाता है ताकि विभिन्न डेटाबेस के बीच रिकॉर्ड को मिलाना आसान हो सके।
एल्गोरिदम फ्रेंच के उच्चारण वाले अक्षरों (जैसे é, è, ê, ç आदि) को प्रोसेस करने से पहले स्वचालित रूप से उनके मूल रूप में बदल देता है। इससे यह सुनिश्चित होता है कि कोड सुसंगत रहें, चाहे मूल डेटा में उच्चारण चिह्न हों या न हों।
प्रथम नाम केवल तब उपयोग किया जाता है जब उपनाम कोड के लिए पर्याप्त अक्षर प्रदान नहीं करता। यदि स्वरों को हटाने के बाद उपनाम में 3 से कम उपयोगी अक्षर बचते हैं, तो कोड में प्रथम नाम का पहला अक्षर जोड़ा जाता है।
Soundex या Metaphone जैसे ध्वन्यात्मक एल्गोरिदम के विपरीत, Statistics Canada कोडिंग पूरी तरह ध्वनि-आधारित नहीं है। यह एक सरल कैरेक्टर‑एक्सट्रैक्शन एल्गोरिदम है, जिसे स्थिरता और सरकारी प्रणालियों में आसान कार्यान्वयन के लिए डिज़ाइन किया गया है, और विशेष रूप से कनाडाई नाम पैटर्न के लिए उपयुक्त है।