encoding | フォネティック | マッチング

> nysiis | 音声 | 名前 <

// NYSIIS - 名前照合と重複排除のための高精度音声エンコーディング

0 文字
0 文字
[ACCURATE]

高い精度

一般的な名前照合において Soundex よりも高い精度を発揮します。

[6-CHAR]

6 文字コード

固定長 6 文字の音声コードを生成し、比較や検索を容易にします.

[OFFICIAL]

公式標準

ニューヨーク州の刑事司法システムなど、政府系システムで利用されている方式です。

>> 技術情報

NYSIIS の仕組み

NYSIIS(New York State Identification and Intelligence System)は、1970 年代に開発された音声エンコーディングアルゴリズムです。名前のつづりではなく発音に基づいてコードを作成し、Soundex よりも多くの接頭辞・接尾辞・文字パターンを考慮します。名前に一連の変換ルールを適用して、レコード照合や重複排除に適した 6 文字の音声コードに変換します。

NYSIIS を使う理由

  • 刑事司法システムでの人物照合
  • 医療や保険システムにおける患者レコードの重複排除
  • 系譜・家系図データの検索
  • 異なるデータベース間のレコードリンク
  • CRM など大量の名前データを扱うアプリケーションでの名前マッチング

NYSIIS エンコーディング例

名前の変換:

Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN

Williams → WALAN
Wiliams → WALAN
Willems → WALAN

特別なケース:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP

主なルール:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- 母音 → A

>> よくある質問

NYSIIS とは何ですか?

NYSIIS は、名前を発音に基づいてコード化するための音声エンコーディングアルゴリズムです。ニューヨーク州の司法システム向けに設計され、つづりが異なっても同じように聞こえる姓を見つけやすくします。

NYSIIS は Soundex とどう違いますか?

NYSIIS は Soundex よりも詳細なルールを持ち、より多くの名前パターンを正しく扱えるよう設計されています。また、4 文字ではなく 6 文字のコードを生成するため、誤検出や取りこぼしを減らすことができます。

拡張(Modified) NYSIIS とは?

拡張 NYSIIS は、母音や特定の子音クラスタの処理を改善した改良版です。一部の名前に対してより安定したマッチング結果が得られます。

現在 NYSIIS はどこで使われていますか?

刑事司法システム、医療・保険レコード、系譜データベース、CRM など、様々な分野で発音ベースの名前照合に利用されています。

コピーしました!