> refined | soundex | encoder <

// Refined Soundex - 多變體強化語音編碼

輸入 0 字元

輸出 0 字元

[強化]

更高精準度

比標準 Soundex 演算法具有更好的比對精準度。

[多變體]

多種變體

支援 Refined、Apache 與 SQL Server 等多種實作。

[語音比對]

智慧語音比對

智慧分組發音相近的子音，降低碰撞與誤判。

>> 技術細節

Refined Soundex 的原理

Refined Soundex 在傳統 Soundex 演算法之上，使用更精細的字元對應規則，以更準確地捕捉語音相似度。演算法保留第一個字母，並將後續子音依照發音特性映射到數字群組。它提供三種主要變體：標準 Refined 版本、Apache Commons 實作，以及與 SQL Server SOUNDEX 函式相容的版本。

為何選擇 Refined Soundex

相較於標準 Soundex，具備更佳的匹配準確度
為不同系統提供多種演算法變體
改良子音分組策略，減少衝突
維持對既有系統的相容性
適合用於資料庫與資料處理流程

Refined Soundex 範例

Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length

Refined mappings:
B,P → 1
F,V → 2
C,K,S → 3
G,J → 4
Q,X,Z → 5
D,T → 6
L → 7
M,N → 8
R → 9

Examples:
THOMPSON → T81938
  T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]

JACKSON → J23938
  J-A-C[2]-K[3]-S[9]-O-N[3][8]

Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings

>> 常見問題

什麼是 Refined Soundex？

Refined Soundex 是在原始 Soundex 演算法上加以改良的版本，用來對姓名進行更精確的語音編碼。它採用更精細的子音對應規則，更貼近實際發音。

它與標準 Soundex 有何不同？

Refined Soundex 使用更多數字群組（0–9 而非 0–6），並且具有更複雜的子音映射。例如，它會將 M 與 N 分配到不同的代碼，並區分比原始演算法更多的子音音素。

應該選擇哪一種變體？

若追求最佳精準度，建議使用標準 Refined 變體；若需要與 Apache Commons Codec 函式庫相容，可以選擇 Apache 變體；若需與 SQL Server 的 SOUNDEX 函式比對，則應使用 SQL Server 變體。

Refined Soundex 是否適用於所有姓名？

Refined Soundex 通常對英文姓名效果最佳，特別是在發音差異較細微的情況下。對於非英文姓名或特定情境，Double Metaphone 或 Daitch-Mokotoff 等演算法可能更合適。