// Refined Soundex - forbedret fonetisk koding med flere varianter
Mer nøyaktig enn den klassiske Soundex-algoritmen.
Støtter Refined-, Apache- og SQL Server-varianter.
Grupperer konsonanter som høres like ut på en smart måte.
Refined Soundex forbedrer den opprinnelige Soundex-algoritmen ved å bruke mer detaljerte tegnmappinger som fanger fonetiske likheter bedre. Den beholder den første bokstaven og koder de påfølgende konsonantene som tallgrupper basert på lydkarakteristikkene deres. Algoritmen tilbyr tre varianter: standard Refined-versjon, Apache Commons-implementasjon og en variant som er kompatibel med SQL Servers SOUNDEX-funksjon.
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex er en forbedret versjon av den opprinnelige Soundex-algoritmen som gir mer presis fonetisk koding av navn. Den bruker forbedrede konsonantmappinger som gjenspeiler den faktiske uttalen bedre.
Refined Soundex bruker flere tallgrupper (0–9 i stedet for 0–6) og mer sofistikerte konsonantmappinger. For eksempel skiller den mellom M og N med ulike koder og skiller flere konsonantlyder enn den opprinnelige algoritmen.
Bruk den vanlige Refined-varianten for best nøyaktighet. Velg Apache-varianten hvis du trenger kompatibilitet med Apache Commons Codec-biblioteket. Bruk SQL Server-varianten når du sammenligner mot SQL Servers SOUNDEX-funksjon.
Refined Soundex gir vanligvis bedre nøyaktighet for engelske navn, spesielt når uttaleforskjellene er små. For ikke-engelske navn eller spesielle bruksområder kan algoritmer som Double Metaphone eller Daitch-Mokotoff være bedre egnet.