// MRA - बुद्धिमान नाम तुलना के लिए Match Rating Approach एल्गोरिदम
नामों के बीच संख्यात्मक समानता की गणना करता है।
पहले 3 और अंतिम 3 अक्षरों का उपयोग कर अनुकूलित कोड।
नाम की लंबाई के आधार पर थ्रेशहोल्ड समायोजित करता है।
Match Rating Approach (MRA) एक ध्वन्यात्मक एल्गोरिदम है जिसे 1977 में Western Airlines द्वारा विकसित किया गया था। यह नामों को एन्कोड करने के लिए स्वरों (पहले अक्षर को छोड़कर) को हटाता है, लगातार समान व्यंजनों को हटाता है और परिणाम को 6 अक्षरों तक सीमित करता है (यदि नाम लंबा हो तो पहले 3 + अंतिम 3)। तुलना चरण में कोडों की शुरुआत और अंत से अक्षरों की तुलना करके समानता की गणना की जाती है, और थ्रेशहोल्ड को दोनों कोडों की सम्मिलित लंबाई के आधार पर समायोजित किया जाता है।
एन्कोडिंग चरण:
1. स्वरों को हटाएँ (पहले को छोड़कर)
2. दोहराए गए व्यंजनों को हटाएँ
3. यदि लंबाई > 6 हो तो पहले 3 + अंतिम 3 अक्षर रखें
उदाहरण:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
मिलान थ्रेशहोल्ड:
योग ≤ 4: 5 मिलान आवश्यक
योग 5–7: 4 मिलान आवश्यक
योग 8–11: 3 मिलान आवश्यक
योग ≥ 12: 2 मिलान आवश्यक
CTHRN बनाम KTHRN:
योग = 10, आवश्यक 3 मिलान
वास्तविक: 4 मिलान → MATCH!
Match Rating Approach (MRA) एक ध्वन्यात्मक एल्गोरिदम है जिसे Western Airlines ने 1977 में यात्री नामों के मिलान के लिए विकसित किया था। यह एन्कोडिंग और तुलना दोनों चरणों को जोड़ता है और नामों के लिए ध्वन्यात्मक कोड के साथ‑साथ समानता स्कोर भी प्रदान करता है।
Soundex या Metaphone केवल कोड प्रदान करते हैं, जबकि MRA एक उन्नत तुलना एल्गोरिदम शामिल करता है जो समानता स्कोर की गणना करता है। यह नाम की लंबाई के आधार पर मिलान थ्रेशहोल्ड को समायोजित करता है, जिससे विभिन्न प्रकार के नामों के लिए अधिक लचीला और सटीक बनता है।
समानता स्कोर दो MRA कोडों की शुरुआत और अंत से तुलना करते समय मिलते‑जुलते अक्षरों की संख्या को दर्शाता है। आवश्यक न्यूनतम स्कोर कोडों की कुल लंबाई के आधार पर बदलता है — छोटे नामों के लिए मैच होने के लिए अधिक समानता की आवश्यकता होती है।
MRA उन अनुप्रयोगों के लिए आदर्श है जहाँ सूक्ष्म नाम मिलान की आवश्यकता होती है: ग्राहक डेटाबेस, वंशावली शोध, धोखाधड़ी का पता लगाना और रिकॉर्ड लिंकिंग। यह विशेष रूप से विभिन्न वर्तनी वाले संभावित डुप्लीकेट रिकॉर्ड ढूँढने में उपयोगी है।