> refined | soundex | encoder <
// Refined Soundex - verbeterde fonetische codering met meerdere varianten
Hogere nauwkeurigheid
Nauwkeuriger dan het standaard Soundex-algoritme.
Meerdere varianten
Ondersteunt Refined-, Apache- en SQL Server-varianten.
Fonetische matching
Groepeert medeklinkers met vergelijkbare klank op intelligente wijze.
>> technische informatie
Hoe Refined Soundex werkt
Refined Soundex verbetert het oorspronkelijke Soundex-algoritme met meer verfijnde tekenmappingen die fonetische overeenkomsten beter vastleggen. De eerste letter blijft behouden en de daaropvolgende medeklinkers worden gecodeerd als cijfergroepen op basis van hun klankeigenschappen. Het algoritme biedt drie varianten: de standaard Refined-versie, de Apache Commons-implementatie en een variant die compatibel is met de SOUNDEX-functie van SQL Server.
Waarom Refined Soundex gebruiken?
- Betere nauwkeurigheid dan standaard Soundex
- Meerdere varianten voor verschillende systemen
- Verbeterde groepering van medeklinkers
- Behoud van achterwaartse compatibiliteit
- Database-vriendelijke codering
Voorbeelden van Refined Soundex
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P → 1
F,V → 2
C,K,S → 3
G,J → 4
Q,X,Z → 5
D,T → 6
L → 7
M,N → 8
R → 9
Examples:
THOMPSON → T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON → J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
>> veelgestelde vragen
Wat is Refined Soundex?
Refined Soundex is een verbeterde versie van het oorspronkelijke Soundex-algoritme die een nauwkeurigere fonetische codering van namen biedt. Het gebruikt verbeterde medeklinkermappingen die de daadwerkelijke uitspraak beter weergeven.
Hoe verschilt het van standaard Soundex?
Refined Soundex gebruikt meer cijfergroepen (0–9 in plaats van 0–6) en meer verfijnde medeklinkermappingen. Zo scheidt het M en N in verschillende codes en onderscheidt het meer medeklinkerklanken dan het oorspronkelijke algoritme.
Welke variant moet ik gebruiken?
Gebruik de standaard Refined-variant voor de hoogste nauwkeurigheid. Kies de Apache-variant als je compatibiliteit met de Apache Commons Codec-bibliotheek nodig hebt. Gebruik de SQL Server-variant wanneer je vergelijkt met de SOUNDEX-functie van SQL Server.
Is Refined Soundex beter voor alle namen?
Refined Soundex biedt meestal betere nauwkeurigheid voor Engelse namen, vooral wanneer de uitspraakverschillen subtiel zijn. Voor niet-Engelse namen of specifieke use-cases kunnen algoritmen zoals Double Metaphone of Daitch-Mokotoff geschikter zijn.