// Refined Soundex - encodage phonétique amélioré avec plusieurs variantes
Plus précis que l'algorithme Soundex classique.
Prend en charge les versions Refined, Apache et SQL Server.
Regroupe intelligemment les consonnes aux sons similaires.
Refined Soundex améliore l'algorithme Soundex original en utilisant des correspondances de caractères plus sophistiquées qui capturent mieux les similitudes phonétiques. Il conserve la première lettre et encode les consonnes suivantes en groupes de chiffres en fonction de leurs caractéristiques sonores. L'algorithme propose trois variantes : la version Refined standard, l'implémentation Apache Commons et une variante compatible avec la fonction SOUNDEX de SQL Server.
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P � 1
F,V � 2
C,K,S � 3
G,J � 4
Q,X,Z � 5
D,T � 6
L � 7
M,N � 8
R � 9
Examples:
THOMPSON � T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON � J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
Refined Soundex est une version améliorée de l'algorithme Soundex original qui fournit un encodage phonétique plus précis des noms. Il utilise des correspondances de consonnes améliorées qui reflètent mieux la prononciation réelle.
Refined Soundex utilise davantage de groupes de chiffres (0–9 au lieu de 0–6) et des correspondances de consonnes plus sophistiquées. Par exemple, il sépare M et N dans des codes différents et distingue plus de sons consonantiques que l'algorithme original.
Utilisez la variante Refined standard pour une précision maximale. Choisissez la variante Apache si vous avez besoin de compatibilité avec la bibliothèque Apache Commons Codec. Utilisez la variante SQL Server si vous devez comparer avec la fonction SOUNDEX de SQL Server.
Refined Soundex offre généralement une meilleure précision pour les noms anglais, en particulier lorsque les différences de prononciation sont subtiles. Pour les noms non anglais ou certains cas d'usage, des algorithmes comme Double Metaphone ou Daitch-Mokotoff peuvent être plus adaptés.