// Metaphone —— 按单词发音建立索引的英文字词音素算法
根据发音而不是拼写对单词进行编码。
找到读音相近、拼写不同的单词。
专为英语发音规则设计的算法。
Metaphone 是一种基于英语发音的音素编码算法。它通过一系列转换规则,将字母及字母组合映射为音素代码。读音相似的单词会产生相同的代码,非常适合用于模糊匹配、拼写检查以及在数据库中按读音匹配人名。
常见转换:\nPH → F (phone → FON)\nCH → X (church → XRCH)\nC+E/I/Y → S (center → SNTR)\nG+E/I/Y → J (george → JRJ)\n\n读音相近的单词:\nSmith → SM0\nSmythe → SM0\nSchmidt → XMT\n\nKnight → NT\nNight → NT\n\nCough → KF\nCoffee → KF
Metaphone 是 Lawrence Philips 于 1990 年提出的一种音素编码算法。相比 Soundex,它使用了更复杂的规则,更贴合英语的实际发音模式。
Metaphone 使用更精细的规则,并考虑字母的位置和组合。相较于最初为姓氏设计、使用简单数字代码的 Soundex,Metaphone 在英语单词上的匹配效果更准确。
Metaphone 编码常用于拼写检查、搜索引擎、数据库去重、家谱研究,以及任何需要将“读音相似但拼写不同”的单词匹配在一起的应用。
是的,Metaphone 主要针对英语发音设计。对于其他语言,更适合的可能是 Cologne phonetic(德语)或 Caverphone(新西兰英语)等算法。