> nysiis | fonetyczne | nazwiska <
// NYSIIS - wysokiej dokładności kodowanie fonetyczne do dopasowywania nazwisk i usuwania duplikatów
Wysoka dokładność
Dokładniejszy niż Soundex w większości scenariuszy dopasowywania nazwisk.
Kod 6‑znakowy
Generuje spójne kody fonetyczne o stałej długości sześciu znaków.
Standard urzędowy
Używany w systemach wymiaru sprawiedliwości i innych rejestrach publicznych stanu Nowy Jork.
>> informacje techniczne
Jak działa NYSIIS
NYSIIS (New York State Identification and Intelligence System) to algorytm kodowania fonetycznego opracowany w latach 70. XX wieku w celu poprawy dopasowywania nazwisk. W odróżnieniu od Soundex używa bogatszego zestawu reguł dotyczących prefiksów, sufiksów i częstych kombinacji liter. Nazwisko jest krok po kroku przekształcane do 6‑znakowego kodu fonetycznego, który dobrze sprawdza się przy łączeniu i deduplikacji rekordów.
Dlaczego warto używać NYSIIS?
- Dopasowywanie osób w systemach wymiaru sprawiedliwości
- Usuwanie duplikatów w rejestrach pacjentów i ubezpieczeniowych
- Badania genealogiczne i historia rodzin
- Łączenie rekordów między różnymi bazami danych
- Systemy CRM z wieloma wariantami pisowni nazwisk
Przykłady kodowania NYSIIS
Przekształcenia nazwisk:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
Przypadki szczególne:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
Kluczowe reguły:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- Samogłoski → A
>> najczęstsze pytania
Czym jest NYSIIS?
NYSIIS to algorytm kodowania fonetycznego, który reprezentuje nazwiska na podstawie ich wymowy, a nie pisowni. Został opracowany dla systemu wymiaru sprawiedliwości stanu Nowy Jork, aby skuteczniej odnajdywać podobnie brzmiące nazwiska.
Jak NYSIIS wypada w porównaniu z Soundexem?
W praktyce NYSIIS często daje lepsze wyniki niż Soundex. Obejmuje więcej przypadków brzegowych, lepiej radzi sobie z wariantami nazwisk i generuje 6‑znakowe kody zamiast 4‑znakowych.
Czym jest zmodyfikowany NYSIIS?
Zmodyfikowany NYSIIS to ulepszona wersja algorytmu, która rozszerza niektóre reguły, zwłaszcza dotyczące samogłosek i grup spółgłoskowych, aby uzyskać stabilniejsze dopasowania.
Gdzie dziś używa się NYSIIS?
Algorytm jest używany w rejestrach wymiaru sprawiedliwości, systemach medycznych i ubezpieczeniowych, bazach genealogicznych oraz w systemach CRM, wszędzie tam, gdzie trzeba grupować podobnie brzmiące nazwiska.