> soundex | fonetik | bulanık eşleştirme <
// Soundex - isimleri seslerine göre indeksleyen fonetik algoritma
Ses temelli
İsimleri yazılışına değil, telaffuzuna göre kodlar.
Bulanık eşleştirme
Farklı yazılsa bile benzer sesli isimleri bulur.
Soy ağacı
Soy ağacı çalışmaları ve tarihsel kayıtlar için kullanışlı bir araçtır.
>> teknik bilgiler
Soundex nasıl çalışır?:
Soundex ilk harfi korur ve kalan ünsüzleri fonetik gruplara göre rakamlara dönüştürür. Benzer sesli ünsüzler aynı rakamı alır, ünlüler yok sayılır ve sonuç 4 karaktere (American) doldurulur veya Refined için değişken uzunlukta bırakılır.
Kodlama kuralları:
1 = B,F,P,V 2 = C,G,J,K,Q,S,X,Z 3 = D,T 4 = L 5 = M,N 6 = R Robert → R163 Rupert → R163 Rubin → R150
Neden Soundex kullanmalı?:
- >Veritabanlarında çift kayıtları bulma
- >Soy ağacı ve aile araştırmaları
- >Nüfus sayımı verilerinin analizi
- >Müşteri kayıtlarını eşleştirme
- >Yazım hatalarını düzeltme
>> sık sorulan sorular
Soundex nedir?
Soundex, 1918 yılında isimleri seslerine göre indekslemek için geliştirilen bir fonetik algoritmadır. ABD nüfus sayımı için tasarlanmış olup, farklı yazılsa bile benzer telaffuzlu soyadlarını bulmayı kolaylaştırır.
American ve Refined Soundex arasındaki fark nedir?
American Soundex, bir harf ve üç rakamdan oluşan 4 karakterlik kodlar üretir. Refined Soundex (örneğin SQL Server’da kullanılır) daha ayrıntılı eşleştirmeler ve değişken uzunlukta kodlar kullanarak eşleştirme doğruluğunu artırır.
Neden farklı yazımlar aynı kodu alabiliyor?
Bu, Soundex’in amacıdır. Smith ve Schmidt örneğinde olduğu gibi, benzer telaffuza sahip isimleri aynı grupta toplayarak veritabanlarında isim varyasyonlarını bulmayı kolaylaştırır.
Soundex’in kısıtları nelerdir?
Soundex esas olarak İngilizce isimler için tasarlanmıştır. Diğer dillerde doğruluk düşebilir ve aynı ismin çok farklı yazımları farklı kodlar üretebilir.