> match | rating | approach <
// MRA - 用於智慧姓名比對的 Match Rating Approach 演算法
0 字元
0 字元
[SCORING]
相似度評分
計算姓名之間的數值相似度。
[6-CHAR]
6 字元編碼
使用前 3 與後 3 個字元產生精簡編碼。
[INTELLIGENT]
智慧匹配
依姓名長度自動調整匹配門檻。
>> 技術說明
Match Rating Approach 的運作原理
Match Rating Approach(MRA)是 Western Airlines 於 1977 年提出的姓名語音比對演算法。它會先刪除母音(首字母除外)、合併連續重複的子音,並將結果壓縮為最多 6 個字元(長度超過 6 時取前 3 + 後 3),以產生姓名的 MRA 代碼;在比對階段,則從頭尾兩端對代碼逐字比較,依兩個代碼的總長度動態計算匹配門檻,判斷是否視為「匹配」。
為什麼選擇 MRA
- >在處理姓名變體時比 Soundex 更精準
- >內建相似度評分機制,方便排序與篩選
- >同時考慮發音差異與拼字差異
- >適用於資料庫去重與合併
- >對家譜研究與跨系統紀錄關聯特別有效
MRA 編碼與匹配範例
編碼步驟:
1. 刪除母音(保留第一個字母)
2. 刪除連續重複的子音
3. 若長度 > 6,保留前 3 + 後 3 個字元
範例:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
匹配門檻:
總長度 ≤ 4:需要 5 個相同字元
總長度 5–7:需要 4 個相同字元
總長度 8–11:需要 3 個相同字元
總長度 ≥ 12:需要 2 個相同字元
CTHRN vs KTHRN:
總長度 = 10,需要 3 個相同字元
實際:4 個相同字元 → MATCH!
>> 常見問題
什麼是 Match Rating Approach?
Match Rating Approach(MRA)是一種用於姓名比對的語音演算法,由 Western Airlines 於 1977 年設計。它結合編碼與比對兩個階段,為每個姓名產生語音代碼,並計算兩個姓名之間的相似度分數。
MRA 與其他語音演算法有何不同?
不同於僅產生代碼的 Soundex 或 Metaphone,MRA 內建更複雜的比對邏輯來計算相似度分數,並會依姓名長度自動調整匹配門檻,因此在各種姓名類型上都更具彈性與準確性。
相似度分數代表什麼?
相似度分數表示在從頭與尾兩端比較兩個 MRA 代碼時,字元相同的數量。所需的最低分數取決於代碼總長度——越短的姓名需要越高的相似度才能被視為有效匹配。
哪些情境適合使用 MRA?
MRA 非常適合用在需要精細姓名比對的情境,例如客戶資料庫去重、家譜研究、詐欺偵測以及跨系統紀錄關聯,特別適合找出不同拼法但可能為同一人的紀錄。