> match | rating | approach <
// MRA - बुद्धिमान नाम तुलना के लिए Match Rating Approach एल्गोरिदम
समानता स्कोरिंग
नामों के बीच संख्यात्मक समानता की गणना करता है।
6 अक्षर की सीमा
पहले 3 और अंतिम 3 अक्षरों का उपयोग कर अनुकूलित कोड।
स्मार्ट मिलान
नाम की लंबाई के आधार पर थ्रेशहोल्ड समायोजित करता है।
>> तकनीकी जानकारी
Match Rating Approach कैसे काम करता है
Match Rating Approach (MRA) एक ध्वन्यात्मक एल्गोरिदम है जिसे 1977 में Western Airlines द्वारा विकसित किया गया था। यह नामों को एन्कोड करने के लिए स्वरों (पहले अक्षर को छोड़कर) को हटाता है, लगातार समान व्यंजनों को हटाता है और परिणाम को 6 अक्षरों तक सीमित करता है (यदि नाम लंबा हो तो पहले 3 + अंतिम 3)। तुलना चरण में कोडों की शुरुआत और अंत से अक्षरों की तुलना करके समानता की गणना की जाती है, और थ्रेशहोल्ड को दोनों कोडों की सम्मिलित लंबाई के आधार पर समायोजित किया जाता है।
MRA क्यों उपयोग करें
- >नाम विविधताओं के लिए Soundex से अधिक सटीक
- >अंतर्निहित समानता स्कोरिंग प्रणाली
- >ध्वन्यात्मक और वर्तनी दोनों प्रकार की विविधताओं को संभालता है
- >डेटाबेस डी‑डुप्लीकेशन के लिए उपयोगी
- >वंशावली अनुसंधान और रिकॉर्ड लिंकिंग के लिए प्रभावी
MRA एन्कोडिंग और मिलान
एन्कोडिंग चरण:
1. स्वरों को हटाएँ (पहले को छोड़कर)
2. दोहराए गए व्यंजनों को हटाएँ
3. यदि लंबाई > 6 हो तो पहले 3 + अंतिम 3 अक्षर रखें
उदाहरण:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
मिलान थ्रेशहोल्ड:
योग ≤ 4: 5 मिलान आवश्यक
योग 5–7: 4 मिलान आवश्यक
योग 8–11: 3 मिलान आवश्यक
योग ≥ 12: 2 मिलान आवश्यक
CTHRN बनाम KTHRN:
योग = 10, आवश्यक 3 मिलान
वास्तविक: 4 मिलान → MATCH!
>> अक्सर पूछे जाने वाले प्रश्न
Match Rating Approach क्या है?
Match Rating Approach (MRA) एक ध्वन्यात्मक एल्गोरिदम है जिसे Western Airlines ने 1977 में यात्री नामों के मिलान के लिए विकसित किया था। यह एन्कोडिंग और तुलना दोनों चरणों को जोड़ता है और नामों के लिए ध्वन्यात्मक कोड के साथ‑साथ समानता स्कोर भी प्रदान करता है।
MRA अन्य ध्वन्यात्मक एल्गोरिदम से कैसे अलग है?
Soundex या Metaphone केवल कोड प्रदान करते हैं, जबकि MRA एक उन्नत तुलना एल्गोरिदम शामिल करता है जो समानता स्कोर की गणना करता है। यह नाम की लंबाई के आधार पर मिलान थ्रेशहोल्ड को समायोजित करता है, जिससे विभिन्न प्रकार के नामों के लिए अधिक लचीला और सटीक बनता है।
समानता स्कोर का क्या अर्थ है?
समानता स्कोर दो MRA कोडों की शुरुआत और अंत से तुलना करते समय मिलते‑जुलते अक्षरों की संख्या को दर्शाता है। आवश्यक न्यूनतम स्कोर कोडों की कुल लंबाई के आधार पर बदलता है — छोटे नामों के लिए मैच होने के लिए अधिक समानता की आवश्यकता होती है।
मुझे MRA कब उपयोग करना चाहिए?
MRA उन अनुप्रयोगों के लिए आदर्श है जहाँ सूक्ष्म नाम मिलान की आवश्यकता होती है: ग्राहक डेटाबेस, वंशावली शोध, धोखाधड़ी का पता लगाना और रिकॉर्ड लिंकिंग। यह विशेष रूप से विभिन्न वर्तनी वाले संभावित डुप्लीकेट रिकॉर्ड ढूँढने में उपयोगी है।