// Refined Soundex - birden fazla varyanta sahip gelişmiş fonetik kodlama
Standart Soundex algoritmasına göre daha doğrudur.
Refined, Apache ve SQL Server sürümlerini destekler.
Benzer sesli ünsüzleri akıllıca gruplandırır.
Refined Soundex, daha gelişmiş karakter eşlemeleri kullanarak orijinal Soundex algoritmasını iyileştirir ve fonetik benzerlikleri daha iyi yakalar. İlk harfi korur ve sonraki ünsüzleri, ses özelliklerine göre rakam grupları olarak kodlar. Algoritma üç varyant sunar: standart Refined sürümü, Apache Commons uygulaması ve SQL Server'ın SOUNDEX işleviyle uyumlu bir sürüm.
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex, özgün Soundex algoritmasının geliştirilmiş bir sürümüdür ve isimler için daha doğru fonetik kodlama sağlar. Gerçek telaffuzu daha iyi yansıtmak için geliştirilmiş ünsüz eşlemeleri kullanır.
Refined Soundex, daha fazla rakam grubu (0–9 yerine 0–6) ve daha gelişmiş ünsüz eşlemeleri kullanır. Örneğin M ve N harflerini farklı kodlara ayırır ve özgün algoritmadan daha fazla ünsüz sesini birbirinden ayırır.
En yüksek doğruluk için standart Refined varyantını kullanın. Apache Commons Codec kütüphanesiyle uyumluluk gerekiyorsa Apache varyantını seçin. SQL Server'ın SOUNDEX işleviyle karşılaştırma yaparken SQL Server varyantını kullanın.
Refined Soundex genellikle İngilizce isimler için, özellikle telaffuz farklarının ince olduğu durumlarda daha iyi doğruluk sağlar. İngilizce olmayan isimler veya özel kullanım senaryoları için Double Metaphone veya Daitch-Mokotoff gibi diğer algoritmalar daha uygun olabilir.