// MRA - Akıllı ad karşılaştırması için Match Rating Approach algoritması
Adlar arasındaki sayısal benzerliği hesaplar.
İlk 3 ve son 3 karakteri kullanan optimize edilmiş kodlar.
Eşik değerini adın uzunluğuna göre ayarlar.
Match Rating Approach (MRA), 1977'de Western Airlines tarafından geliştirilen fonetik bir algoritmadır. İsimleri kodlarken ilk harf hariç ünlüleri kaldırır, yinelenen ünsüzleri temizler ve sonucu 6 karaktere indirger (daha uzun adlarda ilk 3 + son 3). Karşılaştırma aşamasında, kodların başından ve sonundan karakterleri karşılaştırarak benzerliği hesaplar ve eşik değerini kodların toplam uzunluğuna göre ayarlar.
Kodlama adımları:
1. Ünlüleri kaldır (ilk harç hariç)
2. Yinelenen ünsüzleri kaldır
3. Uzunluk > 6 ise ilk 3 + son 3 karakteri koru
Örnekler:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
Eşleşme eşikleri:
Toplam ≤ 4: 5 eşleşme gerekir
Toplam 5–7: 4 eşleşme gerekir
Toplam 8–11: 3 eşleşme gerekir
Toplam ≥ 12: 2 eşleşme gerekir
CTHRN vs KTHRN:
Toplam = 10, gereken eşleşme sayısı = 3
Gerçekte: 4 eşleşme → MATCH!
Match Rating Approach (MRA), Western Airlines tarafından 1977'de yolcu adlarını eşleştirmek için geliştirilen fonetik bir algoritmadır. Kodlama ve karşılaştırma aşamalarını birleştirir ve isimler için hem fonetik kod hem de benzerlik puanı üretir.
Sadece kod üreten Soundex veya Metaphone'un aksine, MRA benzerlik puanı hesaplayan gelişmiş bir karşılaştırma algoritması içerir. Eşleşme eşiğini ad uzunluğuna göre ayarlar, bu da onu farklı ad türleri için daha esnek ve doğru kılar.
Benzerlik puanı, iki MRA kodunu baştan ve sondan karşılaştırırken eşleşen karakterlerin sayısını ifade eder. Gerekli minimum puan kodların toplam uzunluğuna bağlıdır — daha kısa adların eşleşme sayılması için daha yüksek benzerlik gerekir.
MRA, müşteri veritabanları, soy ağacı analizi, sahtekârlık tespiti ve kayıt eşleştirme gibi ayrıntılı ad eşleştirme gerektiren uygulamalar için idealdir. Farklı yazımlara sahip olası yinelenen kayıtları bulurken özellikle kullanışlıdır.