// D-M Soundex - algoritmo de codificação fonética avançado para nomes judeus e do Leste Europeu
Gera vários códigos para pronúncias ambíguas.
Códigos numéricos de 6 dígitos consistentes para todos os nomes.
Otimizado para padrões de nomes em iídiche e hebraico.
Daitch-Mokotoff Soundex, criado em 1985 por Gary Mokotoff e Randy Daitch, é uma versão aprimorada do Soundex americano, projetada especificamente para sobrenomes judeus e do Leste Europeu. Ao contrário do Soundex tradicional, que produz apenas um código, o D-M pode gerar vários códigos para refletir diferentes pronúncias possíveis, o que é especialmente importante para nomes transliterados do hebraico, iídiche, polonês, russo e alemão.
Variações de sobrenomes judeus:
Variações de Cohen:
Cohen → 560000
Cohn → 560000
Kohn → 560000
Kahn → 560000
Kagan → 556000
Variações de Moskowitz:
Moskowitz → 645740
Moscowitz → 645740
Moskovitz → 645740
Moskovich → 645740
Exemplo de múltiplos códigos:
Auerbach → [097500, 097400]
AU → 0 ou 7
Gera dois códigos
Pontos principais:
- CH → 5 ou 4 (dependendo do contexto)
- CK → 5 ou 45
- Vogais iniciais → 0
- DZ, DZH, DZS → 4
- TSH, TZH → 4
Daitch-Mokotoff Soundex é um sistema de codificação fonética criado em 1985 especificamente para sobrenomes judeus e do Leste Europeu. Ele aprimora o American Soundex ao lidar melhor com variações de grafia comuns em nomes transliterados do hebraico, iídiche, polonês, russo e alemão.
D-M Soundex gera vários códigos porque muitas combinações de letras podem ser pronunciadas de maneira diferente dependendo da língua de origem. Por exemplo, "CH" é pronunciado de forma distinta em "Bach" (alemão) e "Chair" (inglês). Vários códigos garantem correspondências mesmo quando a pronúncia original é desconhecida.
D-M Soundex usa códigos numéricos de 6 dígitos (em vez de 4 caracteres), trata muitas combinações adicionais de letras, gera múltiplos códigos para casos ambíguos e é otimizado para padrões de nomes judaicos e do Leste Europeu, que são tratados de forma limitada pelo Soundex americano tradicional.
Ele é amplamente utilizado em bases de dados de genealogia judaica, projetos de memória do Holocausto, registros de imigração, registros de cemitérios e em qualquer sistema que lide com muitos nomes judeus ou do Leste Europeu com múltiplas variantes de grafia e transliteração.