// D-M Soundex - geavanceerde fonetische codering voor Joodse en Oost-Europese namen
Genereert meerdere codes voor onduidelijke uitspraak.
Consistente 6-cijferige numerieke codes voor alle namen.
Geoptimaliseerd voor naampatronen in Jiddisch en Hebreeuws.
Daitch-Mokottoff Soundex, ontwikkeld in 1985 door Gary Mokottoff en Randy Daitch, is een uitbreiding van de Amerikaanse Soundex, speciaal ontworpen voor Joodse en Oost-Europese achternamen. In tegenstelling tot de klassieke Soundex, die slechts één code oplevert, kan D-M meerdere codes genereren om verschillende mogelijke uitspraken af te dekken, vooral belangrijk voor namen die uit het Hebreeuws, Jiddisch, Pools, Russisch en Duits zijn getranslitereerd.
Varianten van Joodse achternamen:
Cohen-varianten:
Cohen → 560000
Cohn → 560000
Kohn → 560000
Kahn → 560000
Kagan → 556000
Moskowitz-varianten:
Moskowitz → 645740
Moscowitz → 645740
Moskovitz → 645740
Moskovich → 645740
Voorbeeld met meerdere codes:
Auerbach → [097500, 097400]
AU → 0 of 7
Levert twee codes op
Belangrijke regels:
- CH → 5 of 4 (afhankelijk van de context)
- CK → 5 of 45
- Beginvocalen → 0
- DZ, DZH, DZS → 4
- TSH, TZH → 4
Daitch-Mokottoff Soundex is een fonetisch coderingssysteem dat in 1985 is ontwikkeld, specifiek voor Joodse en Oost-Europese achternamen. Het verbetert de Amerikaanse Soundex door beter om te gaan met schrijfvarianten in namen die zijn getranslitereerd uit het Hebreeuws, Jiddisch, Pools, Russisch en Duits.
D-M Soundex genereert meerdere codes omdat veel lettercombinaties verschillend worden uitgesproken, afhankelijk van de brontaal. Zo wordt "CH" in het Duitse "Bach" anders uitgesproken dan in het Engelse "Chair". Meerdere codes zorgen voor goede matches, zelfs als de oorspronkelijke uitspraak onbekend is.
D-M Soundex gebruikt numerieke codes van 6 cijfers (in plaats van 4 tekens), ondersteunt meer lettercombinaties, genereert meerdere codes voor ambigue gevallen en is afgestemd op Joodse en Oost-Europese naampatronen, waarmee de traditionele Amerikaanse Soundex moeite heeft.
Het wordt veel gebruikt in Joodse genealogische databanken, Holocaust-herinneringsprojecten, immigratie- en passagiersregisters, begraafplaatsregisters en andere systemen die veel Joodse of Oost-Europese namen met meerdere schrijf- en transliteratievarianten verwerken.