// Refined Soundex - Erweiterte phonetische Kodierung mit mehreren Varianten
Präziser als der klassische Soundex-Algorithmus.
Unterstützt Refined-, Apache- und SQL-Server-Varianten.
Gruppiert ähnlich klingende Konsonanten intelligent.
Refined Soundex verbessert den ursprünglichen Soundex-Algorithmus durch verfeinerte Zeichenzuordnungen, die phonetische Ähnlichkeiten besser erfassen. Der erste Buchstabe bleibt erhalten, während nachfolgende Konsonanten in Zifferngruppen kodiert werden, die ihre Lautmerkmale widerspiegeln. Der Algorithmus bietet drei Varianten: die Standard-Refined-Version, die Apache-Commons-Implementierung und eine Variante, die mit der SQL-Server-Funktion SOUNDEX kompatibel ist.
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex ist eine erweiterte Version des ursprünglichen Soundex-Algorithmus, die eine genauere phonetische Kodierung von Namen ermöglicht. Er verwendet verbesserte Konsonantzuordnungen, die die tatsächliche Aussprache besser abbilden.
Refined Soundex verwendet mehr Zifferngruppen (0–9 statt 0–6) und feinere Konsonantzuordnungen. Zum Beispiel erhalten M und N unterschiedliche Codes und es werden mehr Konsonantlaute unterschieden als im ursprünglichen Algorithmus.
Nutzen Sie die Standard-Refined-Variante für die beste Genauigkeit. Wählen Sie die Apache-Variante, wenn Sie Kompatibilität mit der Apache-Commons-Codec-Bibliothek benötigen. Verwenden Sie die SQL-Server-Variante, wenn Sie mit der SOUNDEX-Funktion von SQL Server vergleichen.
Refined Soundex liefert im Allgemeinen bessere Ergebnisse für englische Namen, besonders bei feinen Ausspracheunterschieden. Bei nichtenglischen Namen oder speziellen Anwendungsfällen können Algorithmen wie Double Metaphone oder Daitch-Mokotoff geeigneter sein.