// Refined Soundex - forbedret fonetisk kodning med flere varianter
Mere præcis end den klassiske Soundex-algoritme.
Understøtter Refined-, Apache- og SQL Server-versioner.
Grupperer konsonanter der lyder ens på en intelligent måde.
Refined Soundex forbedrer den originale Soundex-algoritme ved at bruge mere detaljerede tegnmappinger, der bedre opfanger fonetiske ligheder. Den beholder det første bogstav og koder de efterfølgende konsonanter som talgrupper baseret på deres lyd. Algoritmen tilbyder tre varianter: den standardiserede Refined-version, Apache Commons-implementeringen og en variant der matcher SQL Servers SOUNDEX-funktion.
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex er en udvidet version af den oprindelige Soundex-algoritme, som giver mere præcis fonetisk kodning af navne. Den bruger forbedrede konsonantmappinger der bedre afspejler den faktiske udtale.
Refined Soundex bruger flere talgrupper (0–9 i stedet for 0–6) og mere sofistikerede konsonantmappinger. For eksempel adskiller den M og N i forskellige koder og skelner mellem flere konsonantlyde end den oprindelige algoritme.
Brug den almindelige Refined-variant for bedst nøjagtighed. Vælg Apache-varianten hvis du har brug for kompatibilitet med Apache Commons Codec-biblioteket. Brug SQL Server-varianten når du matcher mod SQL Servers SOUNDEX-funktion.
Refined Soundex giver generelt bedre nøjagtighed for engelske navne, især når forskellene i udtale er små. For ikke-engelske navne eller særlige brugssituationer kan algoritmer som Double Metaphone eller Daitch-Mokotoff være mere velegnede.