// Refined Soundex - förbättrad fonetisk kodning med flera varianter
Mer exakt än den klassiska Soundex-algoritmen.
Stöder Refined-, Apache- och SQL Server-varianter.
Grupperar konsonanter med liknande ljud på ett smart sätt.
Refined Soundex förbättrar den ursprungliga Soundex-algoritmen genom mer avancerade teckenmappningar som bättre fångar fonetiska likheter. Den behåller den första bokstaven och kodar efterföljande konsonanter som siffergrupper baserat på deras ljudegenskaper. Algoritmen erbjuder tre varianter: standard-Refined, Apache Commons-implementeringen och en variant som är kompatibel med SQL Servers SOUNDEX-funktion.
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex är en förbättrad version av den ursprungliga Soundex-algoritmen som ger mer exakt fonetisk kodning av namn. Den använder förbättrade konsonantmappningar som bättre speglar det faktiska uttalet.
Refined Soundex använder fler siffergrupper (0–9 istället för 0–6) och mer sofistikerade konsonantmappningar. Den skiljer till exempel mellan M och N med olika koder och särskiljer fler konsonantljud än originalalgoritmen.
Använd standardvarianten av Refined för högst noggrannhet. Välj Apache-varianten om du behöver kompatibilitet med Apache Commons Codec-biblioteket. Använd SQL Server-varianten när du jämför mot SQL Servers SOUNDEX-funktion.
Refined Soundex ger generellt bättre noggrannhet för engelska namn, särskilt när skillnaderna i uttal är subtila. För icke-engelska namn eller speciella fall kan algoritmer som Double Metaphone eller Daitch-Mokotoff vara mer lämpliga.