// D-M Soundex - zaawansowane kodowanie fonetyczne dla żydowskich i wschodnioeuropejskich nazwisk
Generuje wiele kodów dla niejednoznacznej wymowy.
Spójne 6-cyfrowe kody liczbowe dla wszystkich nazwisk.
Zoptymalizowany pod kątem wzorców nazwisk w jidysz i hebrajskim.
Daitch-Mokotoff Soundex, opracowany w 1985 roku przez Gary'ego Mokotoffa i Randy'ego Daitcha, jest ulepszeniem amerykańskiego Soundexu zaprojektowanym specjalnie dla żydowskich i wschodnioeuropejskich nazwisk. W przeciwieństwie do klasycznego Soundexu, który generuje pojedynczy kod, D-M może tworzyć wiele kodów, aby uwzględnić różne możliwe wymowy, co jest szczególnie ważne w przypadku nazwisk transliterowanych z hebrajskiego, jidysz, polskiego, rosyjskiego i niemieckiego.
Wariacje nazwisk żydowskich:
Warianty nazwiska Cohen:
Cohen → 560000
Cohn → 560000
Kohn → 560000
Kahn → 560000
Kagan → 556000
Warianty nazwiska Moskowitz:
Moskowitz → 645740
Moscowitz → 645740
Moskovitz → 645740
Moskovich → 645740
Przykład wielu kodów:
Auerbach → [097500, 097400]
AU → 0 lub 7
Daje dwa kody
Kluczowe zasady:
- CH → 5 lub 4 (w zależności od kontekstu)
- CK → 5 lub 45
- Samogłoski początkowe → 0
- DZ, DZH, DZS → 4
- TSH, TZH → 4
Daitch-Mokotoff Soundex to system kodowania fonetycznego stworzony w 1985 roku specjalnie dla żydowskich i wschodnioeuropejskich nazwisk. Ulepsza American Soundex, lepiej radząc sobie z typowymi wariantami pisowni nazwisk transliterowanych z hebrajskiego, jidysz, polskiego, rosyjskiego i niemieckiego.
D-M Soundex generuje wiele kodów, ponieważ wiele kombinacji liter może być wymawianych różnie w zależności od języka źródłowego. Na przykład „CH” brzmi inaczej w niemieckim „Bach” i w angielskim „Chair”. Wiele kodów zapewnia poprawne dopasowania nawet wtedy, gdy oryginalna wymowa nie jest znana.
D-M Soundex używa 6-cyfrowych kodów numerycznych (zamiast 4 znaków), obsługuje znacznie więcej kombinacji liter, generuje wiele kodów dla przypadków niejednoznacznych i jest specjalnie dostosowany do wzorców nazwisk żydowskich i wschodnioeuropejskich, z którymi tradycyjny American Soundex ma problemy.
Jest szeroko stosowany w bazach danych genealogii żydowskiej, projektach upamiętniających Holokaust, rejestrach imigracyjnych, rejestrach cmentarzy oraz innych systemach pracujących z dużą liczbą żydowskich i wschodnioeuropejskich nazwisk o wielu wariantach pisowni i transliteracji.