> match | rating | approach <

// MRA - बुद्धिमान नाम तुलना के लिए Match Rating Approach एल्गोरिदम

0 अक्षर
0 अक्षर
[SCORING]

समानता स्कोरिंग

नामों के बीच संख्यात्मक समानता की गणना करता है।

[6-CHAR]

6 अक्षर की सीमा

पहले 3 और अंतिम 3 अक्षरों का उपयोग कर अनुकूलित कोड।

[INTELLIGENT]

स्मार्ट मिलान

नाम की लंबाई के आधार पर थ्रेशहोल्ड समायोजित करता है।

>> तकनीकी जानकारी

Match Rating Approach कैसे काम करता है

Match Rating Approach (MRA) एक ध्वन्यात्मक एल्गोरिदम है जिसे 1977 में Western Airlines द्वारा विकसित किया गया था। यह नामों को एन्कोड करने के लिए स्वरों (पहले अक्षर को छोड़कर) को हटाता है, लगातार समान व्यंजनों को हटाता है और परिणाम को 6 अक्षरों तक सीमित करता है (यदि नाम लंबा हो तो पहले 3 + अंतिम 3)। तुलना चरण में कोडों की शुरुआत और अंत से अक्षरों की तुलना करके समानता की गणना की जाती है, और थ्रेशहोल्ड को दोनों कोडों की सम्मिलित लंबाई के आधार पर समायोजित किया जाता है।

MRA क्यों उपयोग करें

  • नाम विविधताओं के लिए Soundex से अधिक सटीक
  • अंतर्निहित समानता स्कोरिंग प्रणाली
  • ध्वन्यात्मक और वर्तनी दोनों प्रकार की विविधताओं को संभालता है
  • डेटाबेस डी‑डुप्लीकेशन के लिए उपयोगी
  • वंशावली अनुसंधान और रिकॉर्ड लिंकिंग के लिए प्रभावी

MRA एन्कोडिंग और मिलान

एन्कोडिंग चरण:
1. स्वरों को हटाएँ (पहले को छोड़कर)
2. दोहराए गए व्यंजनों को हटाएँ
3. यदि लंबाई > 6 हो तो पहले 3 + अंतिम 3 अक्षर रखें

उदाहरण:
CATHERINE → CTHRN
  C[a]TH[e]R[i]N[e] → CTHRN

KATHERINE → KTHRN
  K[a]TH[e]R[i]N[e] → KTHRN

SMITH → SMTH
  SM[i]TH → SMTH

मिलान थ्रेशहोल्ड:
योग ≤ 4: 5 मिलान आवश्यक
योग 5–7: 4 मिलान आवश्यक
योग 8–11: 3 मिलान आवश्यक
योग ≥ 12: 2 मिलान आवश्यक

CTHRN बनाम KTHRN:
योग = 10, आवश्यक 3 मिलान
वास्तविक: 4 मिलान → MATCH!

>> अक्सर पूछे जाने वाले प्रश्न

Match Rating Approach क्या है?

Match Rating Approach (MRA) एक ध्वन्यात्मक एल्गोरिदम है जिसे Western Airlines ने 1977 में यात्री नामों के मिलान के लिए विकसित किया था। यह एन्कोडिंग और तुलना दोनों चरणों को जोड़ता है और नामों के लिए ध्वन्यात्मक कोड के साथ‑साथ समानता स्कोर भी प्रदान करता है।

MRA अन्य ध्वन्यात्मक एल्गोरिदम से कैसे अलग है?

Soundex या Metaphone केवल कोड प्रदान करते हैं, जबकि MRA एक उन्नत तुलना एल्गोरिदम शामिल करता है जो समानता स्कोर की गणना करता है। यह नाम की लंबाई के आधार पर मिलान थ्रेशहोल्ड को समायोजित करता है, जिससे विभिन्न प्रकार के नामों के लिए अधिक लचीला और सटीक बनता है।

समानता स्कोर का क्या अर्थ है?

समानता स्कोर दो MRA कोडों की शुरुआत और अंत से तुलना करते समय मिलते‑जुलते अक्षरों की संख्या को दर्शाता है। आवश्यक न्यूनतम स्कोर कोडों की कुल लंबाई के आधार पर बदलता है — छोटे नामों के लिए मैच होने के लिए अधिक समानता की आवश्यकता होती है।

मुझे MRA कब उपयोग करना चाहिए?

MRA उन अनुप्रयोगों के लिए आदर्श है जहाँ सूक्ष्म नाम मिलान की आवश्यकता होती है: ग्राहक डेटाबेस, वंशावली शोध, धोखाधड़ी का पता लगाना और रिकॉर्ड लिंकिंग। यह विशेष रूप से विभिन्न वर्तनी वाले संभावित डुप्लीकेट रिकॉर्ड ढूँढने में उपयोगी है।

कॉपी हो गया!