// Double Metaphone – zaawansowane kodowanie fonetyczne do dopasowywania wielojęzycznych nazw
Generuje kod podstawowy i alternatywny, aby lepiej dopasowywać słowa.
Dobrze radzi sobie z imionami pochodzącymi z różnych rodzin językowych.
Dokładniejszy niż oryginalny algorytm Metaphone.
Double Metaphone, opublikowany przez Lawrence'a Philipsa w 2000 roku, to ulepszona wersja algorytmu Metaphone. Generuje dwa kody fonetyczne (podstawowy i alternatywny) dla każdego słowa, uwzględniając różne wymowy i pochodzenie językowe. Takie podwójne kodowanie znacząco poprawia dokładność dopasowywania nazw w języku angielskim, hiszpańskim, włoskim, francuskim, niemieckim oraz językach słowiańskich.
Dwa kody dla lepszego dopasowania:
Schmidt:
Podstawowy: XMT
Alternatywny: SMT
Smith:
Podstawowy: SM0
Alternatywny: XMT
Campbell:
Podstawowy: KMPL
Alternatywny: KMPL
Raspberry:
Podstawowy: RSPR
Alternatywny: RSPR
Imiona obce:
García – [KRS|KRX]
Çelik – [SLK|SLK]
Nguyen – [NKN|NKN]
Dwa słowa uznajemy za pasujące,
jeśli jakakolwiek kombinacja ich kodów jest identyczna.
Double Metaphone to zaawansowany algorytm fonetyczny, który generuje dwa kody dla każdego słowa – podstawowy i alternatywny. Dzięki temu uwzględnia różne wymowy i etymologie, co jest szczególnie przydatne przy dopasowywaniu imion z różnych języków i kultur.
Double Metaphone obejmuje znacznie więcej przypadków brzegowych i wzorców języków obcych. Rozpoznaje charakterystyczne schematy imion w języku hiszpańskim, włoskim, francuskim, językach germańskich i słowiańskich, a następnie generuje odpowiednie kody alternatywne. Dzięki temu dokładność dopasowań dla nazw międzynarodowych jest dużo wyższa.
Warto go stosować przy pracy z danymi wielokulturowymi, w międzynarodowych bazach klientów, badaniach genealogicznych oraz wszędzie tam, gdzie imiona mogą mieć różne zapisy lub pochodzenie językowe.
Kod podstawowy reprezentuje najbardziej prawdopodobną angielską wymowę, natomiast kod alternatywny odzwierciedla inne możliwe wymowy wynikające z pochodzenia językowego słowa. Dwa słowa uznaje się za dopasowane, jeśli jakakolwiek kombinacja ich kodów pokrywa się (podstawowy–podstawowy, podstawowy–alternatywny itd.).