// Refined Soundex - कई वेरिएंट के साथ उन्नत फ़ोनेटिक एन्कोडिंग
मानक Soundex एल्गोरिदम की तुलना में अधिक सटीक।
Refined, Apache और SQL Server वेरिएंट का समर्थन करता है।
एक जैसे सुनाई देने वाले व्यंजनों को बुद्धिमानी से समूहित करता है।
Refined Soundex मूल Soundex एल्गोरिदम को बेहतर कैरेक्टर मैपिंग के साथ सुधारता है जो फ़ोनेटिक समानताओं को अधिक सटीक रूप से पकड़ते हैं। यह पहला अक्षर सुरक्षित रखता है और बाद के व्यंजनों को उनकी ध्वनि विशेषताओं के आधार पर अंकों के समूहों में एन्कोड करता है। एल्गोरिदम तीन वेरिएंट प्रदान करता है: मानक Refined संस्करण, Apache Commons इम्प्लीमेंटेशन और SQL Server की SOUNDEX फ़ंक्शन के साथ संगत वेरिएंट।
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex मूल Soundex एल्गोरिदम का एक उन्नत संस्करण है जो नामों के लिए अधिक सटीक फ़ोनेटिक एन्कोडिंग प्रदान करता है। यह बेहतर व्यंजन मैपिंग का उपयोग करता है जो वास्तविक उच्चारण को बेहतर तरीके से दर्शाती हैं।
Refined Soundex अधिक अंक समूहों (0–9 की बजाय 0–6) और अधिक परिष्कृत व्यंजन मैपिंग का उपयोग करता है। उदाहरण के लिए, यह M और N के लिए अलग-अलग कोड देता है और मूल एल्गोरिदम की तुलना में अधिक व्यंजन ध्वनियों के बीच अंतर करता है।
सर्वोत्तम सटीकता के लिए मानक Refined वेरिएंट का उपयोग करें। यदि आपको Apache Commons Codec लाइब्रेरी के साथ कम्पैटिबिलिटी चाहिए तो Apache वेरिएंट चुनें। SQL Server के SOUNDEX फ़ंक्शन से मिलान करते समय SQL Server वेरिएंट का उपयोग करें।
Refined Soundex आमतौर पर अंग्रेज़ी नामों के लिए बेहतर सटीकता प्रदान करता है, खासकर जब उच्चारण में सूक्ष्म अंतर हों। गैर-अंग्रेज़ी नामों या विशेष उपयोग मामलों में Double Metaphone या Daitch-Mokotoff जैसे एल्गोरिदम अधिक उपयुक्त हो सकते हैं।