> soundex | fonetico | fuzzy <
// Soundex - algoritmo fonetico per indicizzare i nomi in base al suono
Basato sul suono
Codifica i nomi in base alla pronuncia e non all’ortografia.
Fuzzy matching
Trova nomi dal suono simile anche con grafie diverse.
Genealogia
Strumento essenziale per ricerche genealogiche e archivi storici.
>> dettagli tecnici
Come funziona Soundex:
Soundex conserva la prima lettera e sostituisce le consonanti con cifre secondo gruppi fonetici. Le consonanti con suono simile condividono lo stesso numero; le vocali sono ignorate e il risultato viene riempito o troncato a 4 caratteri (American) o a lunghezza variabile (Refined).
Regole di codifica:
1 = B,F,P,V 2 = C,G,J,K,Q,S,X,Z 3 = D,T 4 = L 5 = M,N 6 = R Robert → R163 Rupert → R163 Rubin → R150
Perché usare Soundex?:
- >Rimozione di duplicati nei database
- >Ricerca genealogica
- >Analisi dei censimenti
- >Matching dei clienti
- >Correzione ortografica
>> domande frequenti
Che cos’è Soundex?
Soundex è un algoritmo fonetico brevettato nel 1918 per indicizzare i nomi in base al loro suono. È stato progettato per il censimento degli Stati Uniti per aiutare a trovare cognomi con pronunce simili nonostante ortografie differenti.
Differenza tra American e Refined Soundex?
American Soundex produce codici di 4 caratteri (una lettera + 3 cifre). Refined Soundex (utilizzato ad esempio in SQL Server) usa più gruppi di cifre e codici a lunghezza variabile per una maggiore accuratezza.
Perché grafie diverse hanno lo stesso codice?
È proprio questo lo scopo di Soundex! L’algoritmo raggruppa i nomi che suonano allo stesso modo. Smith e Schmidt, ad esempio, hanno una pronuncia simile e quindi ricevono codici simili per facilitare la ricerca delle varianti.
Quali sono i limiti di Soundex?
Soundex funziona meglio con nomi inglesi. Per altre lingue può essere meno preciso, e alcune grafie molto diverse dello stesso nome possono produrre codici differenti.