> nysiis | 音声 | 名前 <
// NYSIIS - 名前照合と重複排除のための高精度音声エンコーディング
0 文字
0 文字
[ACCURATE]
高い精度
一般的な名前照合において Soundex よりも高い精度を発揮します。
[6-CHAR]
6 文字コード
固定長 6 文字の音声コードを生成し、比較や検索を容易にします.
[OFFICIAL]
公式標準
ニューヨーク州の刑事司法システムなど、政府系システムで利用されている方式です。
>> 技術情報
NYSIIS の仕組み
NYSIIS(New York State Identification and Intelligence System)は、1970 年代に開発された音声エンコーディングアルゴリズムです。名前のつづりではなく発音に基づいてコードを作成し、Soundex よりも多くの接頭辞・接尾辞・文字パターンを考慮します。名前に一連の変換ルールを適用して、レコード照合や重複排除に適した 6 文字の音声コードに変換します。
NYSIIS を使う理由
- 刑事司法システムでの人物照合
- 医療や保険システムにおける患者レコードの重複排除
- 系譜・家系図データの検索
- 異なるデータベース間のレコードリンク
- CRM など大量の名前データを扱うアプリケーションでの名前マッチング
NYSIIS エンコーディング例
名前の変換:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
特別なケース:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
主なルール:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- 母音 → A
>> よくある質問
NYSIIS とは何ですか?
NYSIIS は、名前を発音に基づいてコード化するための音声エンコーディングアルゴリズムです。ニューヨーク州の司法システム向けに設計され、つづりが異なっても同じように聞こえる姓を見つけやすくします。
NYSIIS は Soundex とどう違いますか?
NYSIIS は Soundex よりも詳細なルールを持ち、より多くの名前パターンを正しく扱えるよう設計されています。また、4 文字ではなく 6 文字のコードを生成するため、誤検出や取りこぼしを減らすことができます。
拡張(Modified) NYSIIS とは?
拡張 NYSIIS は、母音や特定の子音クラスタの処理を改善した改良版です。一部の名前に対してより安定したマッチング結果が得られます。
現在 NYSIIS はどこで使われていますか?
刑事司法システム、医療・保険レコード、系譜データベース、CRM など、様々な分野で発音ベースの名前照合に利用されています。