// D-M Soundex — расширенный фонетический алгоритм кодирования для еврейских и восточноевропейских имён
Генерирует несколько кодов для неоднозначных вариантов произношения.
Единые шестизначные числовые коды для всех фамилий.
Оптимизирован для шаблонов имён на идише и иврите.
Daitch-Mokotoff Soundex, созданный в 1985 году Гари Мокотоффом и Рэнди Дайтчем, представляет собой усовершенствованную версию American Soundex, разработанную специально для еврейских и восточноевропейских фамилий. В отличие от классического Soundex, который выдаёт только один код, D-M может генерировать несколько кодов, учитывая различные возможные произношения, что особенно важно для фамилий, транслитерированных с иврита, идиша, польского, русского и немецкого.
Варианты еврейских фамилий:
Варианты Cohen:
Cohen → 560000
Cohn → 560000
Kohn → 560000
Kahn → 560000
Kagan → 556000
Варианты Moskowitz:
Moskowitz → 645740
Moscowitz → 645740
Moskovitz → 645740
Moskovich → 645740
Пример множественных кодов:
Auerbach → [097500, 097400]
AU → 0 или 7
В результате два кода
Ключевые правила:
- CH → 5 или 4 (в зависимости от контекста)
- CK → 5 или 45
- Начальные гласные → 0
- DZ, DZH, DZS → 4
- TSH, TZH → 4
Daitch-Mokotoff Soundex — это система фонетического кодирования, созданная в 1985 году специально для еврейских и восточноевропейских фамилий. Она улучшает American Soundex, лучше обрабатывая разнообразные варианты написания фамилий, транслитерированных с иврита, идиша, польского, русского и немецкого.
D-M Soundex генерирует несколько кодов, потому что многие сочетания букв могут произноситься по-разному в зависимости от исходного языка. Например, «CH» в немецком слове «Bach» произносится иначе, чем в английском слове «Chair». Несколько кодов обеспечивают корректные совпадения даже тогда, когда точное исходное произношение неизвестно.
D-M Soundex использует шестизначные числовые коды (вместо четырёх символов), поддерживает гораздо больше сочетаний букв, генерирует несколько кодов для неоднозначных случаев и специально адаптирован под особенности еврейских и восточноевропейских фамилий, с которыми традиционный American Soundex справляется хуже.
Он широко применяется в базах данных по еврейской генеалогии, проектах памяти о Холокосте, миграционных регистрах, кладбищенских книгах и других системах, где обрабатывается множество еврейских и восточноевропейских фамилий с разными вариантами написания и транслитерации.