// NYSIIS - isim eşleştirme ve çoğaltıların kaldırılması için yüksek doğruluklu fonetik kodlama
Çoğu isim eşleştirme senaryosunda Soundex'e göre daha doğru sonuçlar üretir.
Karşılaştırması kolay, sabit uzunlukta 6 karakterli fonetik kodlar üretir.
New York eyaletinin adli sistemlerinde ve diğer resmî kayıtlarda kullanılan bir standarttır.
NYSIIS (New York State Identification and Intelligence System), soyad eşleştirmesini geliştirmek için 1970'lerde geliştirilmiş bir fonetik kodlama algoritmasıdır. İsimleri yazılış yerine telaffuza göre temsil eder ve Soundex'ten daha ayrıntılı kurallar uygular. İsim, art arda gelen dönüştürme adımlarıyla 6 karakterlik fonetik bir koda dönüştürülür ve bu kod kayıt eşleştirme ile çoğaltıların kaldırılmasında kullanılabilir.
İsim dönüşümleri:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
Özel durumlar:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
Temel kurallar:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- Ünlüler → A
NYSIIS, isimleri yazılışlarından ziyade telaffuzlarına göre kodlayan bir fonetik kodlama algoritmasıdır. New York eyaletinin adli sistemi için geliştirilmiş ve benzer şekilde telaffuz edilen soyadlarını bulmayı kolaylaştırmak için tasarlanmıştır.
Gerçek veriler üzerinde, NYSIIS genellikle Soundex'ten daha yüksek isabet oranı sağlar. Daha fazla özel durumu kapsar ve 4 karakter yerine 6 karakterli kodlar üreterek yanlış eşleşmeleri azaltır.
Geliştirilmiş NYSIIS, özellikle ünlüler ve bazı ünsüz kümeleri için ek kurallar içeren geliştirilmiş bir sürümdür ve belirli isim türleri için daha tutarlı sonuçlar üretir.
NYSIIS; adli ve polis sistemlerinde, sağlık ve sigorta kayıtlarında, soy ağacı veritabanlarında ve CRM platformlarında, telaffuza dayalı isim eşleştirmenin önemli olduğu pek çok alanda kullanılmaktadır.