> match | rating | approach <

// MRA - Akıllı ad karşılaştırması için Match Rating Approach algoritması

0 karakter
0 karakter
[SCORING]

Benzerlik puanlama

Adlar arasındaki sayısal benzerliği hesaplar.

[6-CHAR]

6 karakter sınırı

İlk 3 ve son 3 karakteri kullanan optimize edilmiş kodlar.

[INTELLIGENT]

Akıllı eşleştirme

Eşik değerini adın uzunluğuna göre ayarlar.

>> teknik bilgiler

Match Rating Approach nasıl çalışır?

Match Rating Approach (MRA), 1977'de Western Airlines tarafından geliştirilen fonetik bir algoritmadır. İsimleri kodlarken ilk harf hariç ünlüleri kaldırır, yinelenen ünsüzleri temizler ve sonucu 6 karaktere indirger (daha uzun adlarda ilk 3 + son 3). Karşılaştırma aşamasında, kodların başından ve sonundan karakterleri karşılaştırarak benzerliği hesaplar ve eşik değerini kodların toplam uzunluğuna göre ayarlar.

Neden MRA kullanmalısınız?

  • İsim varyasyonları için Soundex'ten daha isabetlidir
  • Dahili benzerlik puanlama sistemi
  • Hem fonetik hem yazım varyasyonlarını işler
  • Veritabanı çoğaltmalarını temizlemek için kullanışlıdır
  • Soy ağacı araştırması ve kayıt eşleştirme için etkilidir

MRA kodlama ve eşleştirme

Kodlama adımları:
1. Ünlüleri kaldır (ilk harç hariç)
2. Yinelenen ünsüzleri kaldır
3. Uzunluk > 6 ise ilk 3 + son 3 karakteri koru

Örnekler:
CATHERINE → CTHRN
  C[a]TH[e]R[i]N[e] → CTHRN

KATHERINE → KTHRN
  K[a]TH[e]R[i]N[e] → KTHRN

SMITH → SMTH
  SM[i]TH → SMTH

Eşleşme eşikleri:
Toplam ≤ 4: 5 eşleşme gerekir
Toplam 5–7: 4 eşleşme gerekir
Toplam 8–11: 3 eşleşme gerekir
Toplam ≥ 12: 2 eşleşme gerekir

CTHRN vs KTHRN:
Toplam = 10, gereken eşleşme sayısı = 3
Gerçekte: 4 eşleşme → MATCH!

>> sık sorulan sorular

Match Rating Approach nedir?

Match Rating Approach (MRA), Western Airlines tarafından 1977'de yolcu adlarını eşleştirmek için geliştirilen fonetik bir algoritmadır. Kodlama ve karşılaştırma aşamalarını birleştirir ve isimler için hem fonetik kod hem de benzerlik puanı üretir.

MRA diğer fonetik algoritmalardan nasıl farklıdır?

Sadece kod üreten Soundex veya Metaphone'un aksine, MRA benzerlik puanı hesaplayan gelişmiş bir karşılaştırma algoritması içerir. Eşleşme eşiğini ad uzunluğuna göre ayarlar, bu da onu farklı ad türleri için daha esnek ve doğru kılar.

Benzerlik puanı ne anlama gelir?

Benzerlik puanı, iki MRA kodunu baştan ve sondan karşılaştırırken eşleşen karakterlerin sayısını ifade eder. Gerekli minimum puan kodların toplam uzunluğuna bağlıdır — daha kısa adların eşleşme sayılması için daha yüksek benzerlik gerekir.

MRA'yı ne zaman kullanmalıyım?

MRA, müşteri veritabanları, soy ağacı analizi, sahtekârlık tespiti ve kayıt eşleştirme gibi ayrıntılı ad eşleştirme gerektiren uygulamalar için idealdir. Farklı yazımlara sahip olası yinelenen kayıtları bulurken özellikle kullanışlıdır.

KOPYALANDI!