> match | rating | approach <
// MRA - Akıllı ad karşılaştırması için Match Rating Approach algoritması
Benzerlik puanlama
Adlar arasındaki sayısal benzerliği hesaplar.
6 karakter sınırı
İlk 3 ve son 3 karakteri kullanan optimize edilmiş kodlar.
Akıllı eşleştirme
Eşik değerini adın uzunluğuna göre ayarlar.
>> teknik bilgiler
Match Rating Approach nasıl çalışır?
Match Rating Approach (MRA), 1977'de Western Airlines tarafından geliştirilen fonetik bir algoritmadır. İsimleri kodlarken ilk harf hariç ünlüleri kaldırır, yinelenen ünsüzleri temizler ve sonucu 6 karaktere indirger (daha uzun adlarda ilk 3 + son 3). Karşılaştırma aşamasında, kodların başından ve sonundan karakterleri karşılaştırarak benzerliği hesaplar ve eşik değerini kodların toplam uzunluğuna göre ayarlar.
Neden MRA kullanmalısınız?
- >İsim varyasyonları için Soundex'ten daha isabetlidir
- >Dahili benzerlik puanlama sistemi
- >Hem fonetik hem yazım varyasyonlarını işler
- >Veritabanı çoğaltmalarını temizlemek için kullanışlıdır
- >Soy ağacı araştırması ve kayıt eşleştirme için etkilidir
MRA kodlama ve eşleştirme
Kodlama adımları:
1. Ünlüleri kaldır (ilk harç hariç)
2. Yinelenen ünsüzleri kaldır
3. Uzunluk > 6 ise ilk 3 + son 3 karakteri koru
Örnekler:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
Eşleşme eşikleri:
Toplam ≤ 4: 5 eşleşme gerekir
Toplam 5–7: 4 eşleşme gerekir
Toplam 8–11: 3 eşleşme gerekir
Toplam ≥ 12: 2 eşleşme gerekir
CTHRN vs KTHRN:
Toplam = 10, gereken eşleşme sayısı = 3
Gerçekte: 4 eşleşme → MATCH!
>> sık sorulan sorular
Match Rating Approach nedir?
Match Rating Approach (MRA), Western Airlines tarafından 1977'de yolcu adlarını eşleştirmek için geliştirilen fonetik bir algoritmadır. Kodlama ve karşılaştırma aşamalarını birleştirir ve isimler için hem fonetik kod hem de benzerlik puanı üretir.
MRA diğer fonetik algoritmalardan nasıl farklıdır?
Sadece kod üreten Soundex veya Metaphone'un aksine, MRA benzerlik puanı hesaplayan gelişmiş bir karşılaştırma algoritması içerir. Eşleşme eşiğini ad uzunluğuna göre ayarlar, bu da onu farklı ad türleri için daha esnek ve doğru kılar.
Benzerlik puanı ne anlama gelir?
Benzerlik puanı, iki MRA kodunu baştan ve sondan karşılaştırırken eşleşen karakterlerin sayısını ifade eder. Gerekli minimum puan kodların toplam uzunluğuna bağlıdır — daha kısa adların eşleşme sayılması için daha yüksek benzerlik gerekir.
MRA'yı ne zaman kullanmalıyım?
MRA, müşteri veritabanları, soy ağacı analizi, sahtekârlık tespiti ve kayıt eşleştirme gibi ayrıntılı ad eşleştirme gerektiren uygulamalar için idealdir. Farklı yazımlara sahip olası yinelenen kayıtları bulurken özellikle kullanışlıdır.