// Refined Soundex - verbeterde fonetische codering met meerdere varianten
Nauwkeuriger dan het standaard Soundex-algoritme.
Ondersteunt Refined-, Apache- en SQL Server-varianten.
Groepeert medeklinkers met vergelijkbare klank op intelligente wijze.
Refined Soundex verbetert het oorspronkelijke Soundex-algoritme met meer verfijnde tekenmappingen die fonetische overeenkomsten beter vastleggen. De eerste letter blijft behouden en de daaropvolgende medeklinkers worden gecodeerd als cijfergroepen op basis van hun klankeigenschappen. Het algoritme biedt drie varianten: de standaard Refined-versie, de Apache Commons-implementatie en een variant die compatibel is met de SOUNDEX-functie van SQL Server.
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex is een verbeterde versie van het oorspronkelijke Soundex-algoritme die een nauwkeurigere fonetische codering van namen biedt. Het gebruikt verbeterde medeklinkermappingen die de daadwerkelijke uitspraak beter weergeven.
Refined Soundex gebruikt meer cijfergroepen (0–9 in plaats van 0–6) en meer verfijnde medeklinkermappingen. Zo scheidt het M en N in verschillende codes en onderscheidt het meer medeklinkerklanken dan het oorspronkelijke algoritme.
Gebruik de standaard Refined-variant voor de hoogste nauwkeurigheid. Kies de Apache-variant als je compatibiliteit met de Apache Commons Codec-bibliotheek nodig hebt. Gebruik de SQL Server-variant wanneer je vergelijkt met de SOUNDEX-functie van SQL Server.
Refined Soundex biedt meestal betere nauwkeurigheid voor Engelse namen, vooral wanneer de uitspraakverschillen subtiel zijn. Voor niet-Engelse namen of specifieke use-cases kunnen algoritmen zoals Double Metaphone of Daitch-Mokotoff geschikter zijn.