> soundex | fonetisch | fuzzy <
// Soundex - fonetisch algoritme om namen op klank te indexeren
Op klank gebaseerd
Codeert namen op basis van uitspraak in plaats van spelling.
Fuzzy‑matching
Zoekt namen die vergelijkbaar klinken, zelfs met verschillende spelling.
Genealogie
Essentieel hulpmiddel voor genealogisch onderzoek en historische registers.
>> technische info
Hoe Soundex werkt:
Soundex bewaart de eerste letter en vervangt medeklinkers door cijfers op basis van fonetische groepen. Medeklinkers die hetzelfde klinken krijgen hetzelfde cijfer; klinkers worden genegeerd en het resultaat wordt opgevuld of ingekort tot 4 tekens (American) of een variabele lengte (Refined).
Codeerregels:
1 = B,F,P,V 2 = C,G,J,K,Q,S,X,Z 3 = D,T 4 = L 5 = M,N 6 = R Robert → R163 Rupert → R163 Rubin → R150
Waarom Soundex gebruiken?:
- >Dubbelingen in databases opsporen
- >Genealogisch onderzoek
- >Analyse van volkstellingen
- >Klant‑ en contactmatching
- >Spellingcorrectie
>> veelgestelde vragen
Wat is Soundex?
Soundex is een fonetisch algoritme uit 1918 om namen op basis van hun klank te indexeren. Het werd ontwikkeld voor de Amerikaanse volkstelling om familienamen met vergelijkbare uitspraak makkelijker terug te vinden, zelfs bij verschillende spelling.
American vs. Refined Soundex?
American Soundex genereert codes van vier tekens (een letter + drie cijfers). Refined Soundex (zoals gebruikt in SQL Server) gebruikt meer gedetailleerde mappen en codes met variabele lengte voor hogere nauwkeurigheid.
Waarom krijgen verschillende spellingen dezelfde code?
Dat is precies de bedoeling. Soundex groepeert namen die hetzelfde klinken, zoals Smith en Schmidt, zodat varianten van een naam in databases eenvoudiger gevonden kunnen worden.
Wat zijn de beperkingen van Soundex?
Soundex werkt het best met Engelse namen. Voor andere talen kan de kwaliteit variëren en sterk verschillende spellingen van hetzelfde naamtype kunnen verschillende codes opleveren.