// Refined Soundex - ترميز صوتي محسّن مع عدة إصدارات
أكثر دقة من خوارزمية Soundex القياسية.
يدعم نسخ Refined و Apache و SQL Server.
يجمع الحروف الساكنة المتشابهة في النطق بطريقة ذكية.
تحسّن خوارزمية Refined Soundex النسخة الأصلية من Soundex باستخدام خرائط أحرف أكثر دقة تلتقط التشابهات الصوتية بشكل أفضل. تحتفظ بالحرف الأول وتحوّل الحروف الساكنة التالية إلى مجموعات أرقام تعكس خصائصها الصوتية. توفر الخوارزمية ثلاث نسخ: النسخة المحسّنة القياسية، وتنفيذ Apache Commons، ونسخة متوافقة مع دالة SOUNDEX في SQL Server.
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex هو نسخة محسّنة من خوارزمية Soundex الأصلية توفر ترميزاً صوتياً أكثر دقة للأسماء. يستخدم خرائط حروف محسّنة تمثل طريقة النطق الفعلية بشكل أفضل.
يستخدم Refined Soundex مجموعات أرقام أكثر (0–9 بدلاً من 0–6) وخرائط أكثر دقة للحروف الساكنة. على سبيل المثال يفصل بين الحرفين M و N في أكواد مختلفة ويميز بين عدد أكبر من الأصوات الساكنة مقارنة بالخوارزمية الأصلية.
استخدم النسخة المحسّنة القياسية لأعلى دقة. اختر نسخة Apache إذا كنت تحتاج إلى التوافق مع مكتبة Apache Commons Codec. استخدم نسخة SQL Server عند المقارنة مع دالة SOUNDEX في SQL Server.
يوفّر Refined Soundex عادةً دقة أفضل للأسماء الإنجليزية، خاصة عند وجود فروق بسيطة في النطق. أما للأسماء غير الإنجليزية أو الحالات الخاصة فقد تكون خوارزميات مثل Double Metaphone أو Daitch-Mokotoff أنسب.