// NYSIIS - codificação fonética de alta precisão para correspondência de nomes e remoção de duplicados
Mais preciso do que Soundex na maioria dos cenários de correspondência de nomes.
Gera códigos fonéticos consistentes com comprimento fixo de 6 caracteres.
Utilizado em sistemas de justiça penal e outros registos governamentais do Estado de Nova Iorque.
NYSIIS (New York State Identification and Intelligence System) é um algoritmo de codificação fonética desenvolvido na década de 1970 para melhorar a correspondência de apelidos. Ao contrário do Soundex, aplica um conjunto mais rico de regras para prefixos, sufixos e combinações de letras frequentes. O nome é transformado passo a passo num código fonético de 6 caracteres, adequado para desduplicação e ligação de registos.
Transformações de nomes:
Johnson → JANSAN
Jonsen → JANSAN
Jensen → JANSAN
Williams → WALAN
Wiliams → WALAN
Willems → WALAN
Casos especiais:
MacDonald → MCDANALD
Knudsen → NNADSAN
Schmidt → SSNAT
Phillips → FFALAP
Regras principais:
- MAC → MCC
- KN → NN
- PH → FF
- SCH → SSS
- Vogais → A
NYSIIS é um algoritmo de codificação fonética que representa nomes com base na pronúncia em vez da ortografia. Foi criado para o sistema de justiça do Estado de Nova Iorque para encontrar apelidos que soam de forma semelhante.
Na prática, o NYSIIS costuma oferecer melhores resultados do que o Soundex. Abrange mais casos de borda, lida melhor com variações de nomes e produz códigos alfanuméricos de 6 caracteres em vez de 4.
O NYSIIS modificado é uma variante melhorada que ajusta algumas regras, especialmente para vogais e certos grupos consonantais, para gerar correspondências mais estáveis.
É utilizado em sistemas de justiça, hospitais e seguradoras, bases de dados de genealogia e plataformas de CRM – em qualquer lugar onde seja importante agrupar nomes que soam iguais.