// D-M Soundex – algorithme de codage phonétique avancé pour les noms juifs et d'Europe de l'Est
Génère plusieurs codes pour les prononciations ambiguës.
Codes numériques à 6 chiffres cohérents pour tous les noms.
Optimisé pour les schémas de noms en yiddish et en hébreu.
Daitch-Mokotoff Soundex, créé en 1985 par Gary Mokotoff et Randy Daitch, est une amélioration du Soundex américain conçue spécialement pour les noms de famille juifs et d'Europe de l'Est. Contrairement au Soundex classique qui produit un seul code, D-M peut générer plusieurs codes afin de prendre en compte les différentes prononciations possibles, en particulier pour les noms translittérés de l'hébreu, du yiddish, du polonais, du russe et de l'allemand.
Variantes de noms juifs :
Variantes de Cohen :
Cohen → 560000
Cohn → 560000
Kohn → 560000
Kahn → 560000
Kagan → 556000
Variantes de Moskowitz :
Moskowitz → 645740
Moscowitz → 645740
Moskovitz → 645740
Moskovich → 645740
Exemple de codes multiples :
Auerbach → [097500, 097400]
AU → 0 ou 7
Donne deux codes
Points clés :
- CH → 5 ou 4 (selon le contexte)
- CK → 5 ou 45
- Voyelles initiales → 0
- DZ, DZH, DZS → 4
- TSH, TZH → 4
Daitch-Mokotoff Soundex est un système de codage phonétique créé en 1985 spécialement pour les noms de famille juifs et d'Europe de l'Est. Il améliore le Soundex américain en gérant mieux les variations d'orthographe courantes dans les noms translittérés de l'hébreu, du yiddish, du polonais, du russe et de l'allemand.
D-M Soundex génère plusieurs codes car de nombreuses combinaisons de lettres peuvent se prononcer différemment selon la langue d'origine. Par exemple, « CH » ne se prononce pas de la même façon dans le « Bach » allemand et dans le « Chair » anglais. Plusieurs codes garantissent des correspondances même lorsque la prononciation d'origine est inconnue.
D-M Soundex utilise des codes numériques à 6 chiffres (au lieu de 4 caractères), gère davantage de combinaisons de lettres, génère plusieurs codes pour les cas ambigus et est spécialement adapté aux schémas de noms juifs et d'Europe de l'Est, que le Soundex américain traditionnel traite mal.
Il est largement utilisé dans les bases de données de généalogie juive, les projets mémoriaux de la Shoah, les registres d'immigration, les registres de cimetières et dans tout système qui traite de nombreux noms juifs ou d'Europe de l'Est avec de multiples variantes d'orthographe et de translittération.