// D-M Soundex - ユダヤ系および東欧系姓名向けの高度な音声エンコード
発音があいまいな場合に複数のコードを生成します。
すべての名前に一貫した 6 桁の数値コードを割り当てます。
イディッシュ語やヘブライ語の姓名パターンにあわせて最適化されています。
Daitch-Mokotoff Soundex は、Gary Mokotoff と Randy Daitch によって 1985 年に考案された、ユダヤ系および東欧系の姓向けに設計された American Soundex の拡張版です。従来の Soundex が 1 つのコードしか生成しないのに対し、D-M は複数の可能な発音をカバーできるよう複数のコードを生成します。これは特にヘブライ語、イディッシュ語、ポーランド語、ロシア語、ドイツ語からの転写に対して重要です。
ユダヤ系姓のバリエーション:
Cohen 系:
Cohen → 560000
Cohn → 560000
Kohn → 560000
Kahn → 560000
Kagan → 556000
Moskowitz 系:
Moskowitz → 645740
Moscowitz → 645740
Moskovitz → 645740
Moskovich → 645740
複数コードの例:
Auerbach → [097500, 097400]
AU → 0 または 7
2 つのコードが生成されます
主なルール:
- CH → 5 または 4(文脈による)
- CK → 5 または 45
- 語頭の母音 → 0
- DZ, DZH, DZS → 4
- TSH, TZH → 4
Daitch-Mokotoff Soundex は、1985 年に開発されたユダヤ系および東欧系の姓専用の音声コード方式です。ヘブライ語、イディッシュ語、ポーランド語、ロシア語、ドイツ語などから転写された名前に多い綴りの揺れを、従来の American Soundex よりも適切に扱えるようになっています。
D-M Soundex が複数のコードを生成するのは、多くの文字の組み合わせが言語によって異なる読み方を持つからです。たとえば "CH" は、ドイツ語の「Bach」と英語の「Chair」で発音が異なります。複数コードにより、元の発音がはっきりしない場合でも正しい名前の一致を得やすくなります。
D-M Soundex は 4 文字コードではなく 6 桁の数値コードを用い、より多くの文字パターンに対応し、あいまいなケースでは複数コードを生成します。また、ユダヤ系および東欧系の姓名パターンに特化して調整されており、その点で従来の American Soundex より優れています。
D-M Soundex は、ユダヤ系系譜データベース、ホロコースト追悼プロジェクト、移民記録、墓地記録など、多数のユダヤ系・東欧系姓名を扱うシステムで広く利用されています。