// Phonex — расширенное фонетическое кодирование для сопоставления имён
До 8 символов для более точного различения имён.
Группирует согласные с похожим звучанием.
Коды переменной длины с заполнением нулями.
Phonex — это алгоритм фонетического кодирования, разработанный для улучшенного сопоставления имён. Он сохраняет первую букву, применяет специальные правила для сочетаний (например, PH→F и KN→N), группирует похожие согласные и удаляет гласные, кроме случаев, когда они разделяют согласные. В результате получаются коды длиной 4–8 символов, отражающие звук имени и допускающие вариации написания.
Отображения согласных: B,P,V,F → B C,K,Q,G,J → C S,Z,X → S D,T → D L → L M,N → M R → R Специальные сочетания: PH → F, KN → N GH → удаляется WR → R Примеры: STEPHEN → SDBM0 S-T[D]-[e]-PH[F→B]-[e]-N[M] ASHCRAFT → ASCRF0 A-S[S]-H[удалено]-C[C]-R[R]-A[удалено]-F[B]-T[D] KNIGHT → NCD0 KN[N]-I[удалено]-GH[удалено]-T[D]
Phonex — алгоритм фонетического кодирования, созданный как развитие более ранних систем, таких как Soundex. Он лучше обрабатывает группы согласных, немые буквы и типичные орфографические различия в английских именах.
Phonex использует более сложные группы согласных, обрабатывает специальные буквенные сочетания (PH, KN, GH), создаёт более длинные коды (4–8 символов вместо 4) и лучше сохраняет фонетическую структуру имени.
Phonex подходит для сопоставления английских имён с разным написанием, для генеалогических исследований, дедупликации клиентских баз и любых задач, где важна фонетическая схожесть имён.
Phonex оптимизирован для английских имён и может работать хуже с именами из других языков. Для них стоит рассмотреть алгоритмы Double Metaphone или Daitch-Mokotoff.