// NYSIIS - 名前照合と重複排除のための高精度音声エンコーディング
一般的な名前照合において Soundex よりも高い精度を発揮します。
固定長 6 文字の音声コードを生成し、比較や検索を容易にします.
ニューヨーク州の刑事司法システムなど、政府系システムで利用されている方式です。
NYSIIS(New York State Identification and Intelligence System)は、1970 年代に開発された音声エンコーディングアルゴリズムです。名前のつづりではなく発音に基づいてコードを作成し、Soundex よりも多くの接頭辞・接尾辞・文字パターンを考慮します。名前に一連の変換ルールを適用して、レコード照合や重複排除に適した 6 文字の音声コードに変換します。
名前の変換:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
特別なケース:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
主なルール:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- 母音 → A
NYSIIS は、名前を発音に基づいてコード化するための音声エンコーディングアルゴリズムです。ニューヨーク州の司法システム向けに設計され、つづりが異なっても同じように聞こえる姓を見つけやすくします。
NYSIIS は Soundex よりも詳細なルールを持ち、より多くの名前パターンを正しく扱えるよう設計されています。また、4 文字ではなく 6 文字のコードを生成するため、誤検出や取りこぼしを減らすことができます。
拡張 NYSIIS は、母音や特定の子音クラスタの処理を改善した改良版です。一部の名前に対してより安定したマッチング結果が得られます。
刑事司法システム、医療・保険レコード、系譜データベース、CRM など、様々な分野で発音ベースの名前照合に利用されています。