// MRA - خوارزمية Match Rating Approach لمقارنة الأسماء بذكاء
يحسب درجة تشابه رقمية بين الأسماء.
رموز محسَّنة باستخدام أول 3 وآخر 3 أحرف.
يضبط العتبة بناءً على طول الاسم.
خوارزمية Match Rating Approach (MRA) هي خوارزمية صوتية طُوِّرت من قبل شركة Western Airlines عام 1977. تقوم بترميز الأسماء عن طريق إزالة الحروف المتحركة (باستثناء الحرف الأول)، وحذف الحروف الساكنة المكررة، وتقليص النتيجة إلى 6 أحرف (أول 3 + آخر 3 إذا كان الاسم أطول). في مرحلة المقارنة يتم حساب درجة التشابه من خلال مقارنة الأحرف من البداية والنهاية، مع ضبط عتبة القبول بناءً على الطول الإجمالي للرمزين.
خطوات الترميز:
1. إزالة الحروف المتحركة (عدا الأول)
2. إزالة الحروف الساكنة المكررة
3. الاحتفاظ بأول 3 + آخر 3 أحرف إذا كان الطول > 6
أمثلة:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
عتبات المطابقة:
مجموع الطول ≤ 4: نحتاج 5 تطابقات
المجموع 5–7: نحتاج 4 تطابقات
المجموع 8–11: نحتاج 3 تطابقات
المجموع ≥ 12: نحتاج 2 تطابقات
CTHRN مقابل KTHRN:
المجموع = 10، نحتاج 3 تطابقات
النتيجة: 4 تطابقات → تطابق!
Match Rating Approach (MRA) هي خوارزمية صوتية طُوِّرت من قبل Western Airlines عام 1977 لمطابقة أسماء الركاب. تجمع بين مرحلة الترميز ومرحلة المقارنة، وتوفر كودًا صوتيًا بالإضافة إلى درجة تشابه بين الأسماء.
على عكس Soundex أو Metaphone التي تنتج رموزًا فقط، تتضمن MRA خوارزمية مقارنة متقدمة تحسب درجات التشابه. كما تضبط عتبة المطابقة اعتمادًا على طول الاسم، مما يجعلها أكثر مرونة ودقة لأنواع مختلفة من الأسماء.
درجة التشابه هي عدد الأحرف المتطابقة عند مقارنة رمزين من MRA من البداية والنهاية. يختلف الحد الأدنى المطلوب بحسب الطول الإجمالي للرمزين — فالأسماء الأقصر تحتاج درجة أعلى لتُعتبَر متطابقة.
تُعد MRA مناسبة للتطبيقات التي تتطلب مطابقة دقيقة للأسماء: قواعد بيانات العملاء، أبحاث الأنساب، كشف الاحتيال، وربط السجلات. وهي فعّالة بشكل خاص عند البحث عن سجلات متكررة ذات تهجئات مختلفة.