codifica | decodifica | comprimi

> soundex | fonetico | fuzzy <

// Soundex - algoritmo fonetico per indicizzare i nomi in base al suono

[PHONETIC]

Basato sul suono

Codifica i nomi in base alla pronuncia e non all’ortografia.

[FUZZY]

Fuzzy matching

Trova nomi dal suono simile anche con grafie diverse.

[GENEALOGY]

Genealogia

Strumento essenziale per ricerche genealogiche e archivi storici.

>> dettagli tecnici

Come funziona Soundex:

Soundex conserva la prima lettera e sostituisce le consonanti con cifre secondo gruppi fonetici. Le consonanti con suono simile condividono lo stesso numero; le vocali sono ignorate e il risultato viene riempito o troncato a 4 caratteri (American) o a lunghezza variabile (Refined).

Regole di codifica:

1 = B,F,P,V 2 = C,G,J,K,Q,S,X,Z 3 = D,T 4 = L 5 = M,N 6 = R Robert → R163 Rupert → R163 Rubin → R150

Perché usare Soundex?:

  • >Rimozione di duplicati nei database
  • >Ricerca genealogica
  • >Analisi dei censimenti
  • >Matching dei clienti
  • >Correzione ortografica

>> domande frequenti

Che cos’è Soundex?

Soundex è un algoritmo fonetico brevettato nel 1918 per indicizzare i nomi in base al loro suono. È stato progettato per il censimento degli Stati Uniti per aiutare a trovare cognomi con pronunce simili nonostante ortografie differenti.

Differenza tra American e Refined Soundex?

American Soundex produce codici di 4 caratteri (una lettera + 3 cifre). Refined Soundex (utilizzato ad esempio in SQL Server) usa più gruppi di cifre e codici a lunghezza variabile per una maggiore accuratezza.

Perché grafie diverse hanno lo stesso codice?

È proprio questo lo scopo di Soundex! L’algoritmo raggruppa i nomi che suonano allo stesso modo. Smith e Schmidt, ad esempio, hanno una pronuncia simile e quindi ricevono codici simili per facilitare la ricerca delle varianti.

Quali sono i limiti di Soundex?

Soundex funziona meglio con nomi inglesi. Per altre lingue può essere meno preciso, e alcune grafie molto diverse dello stesso nome possono produrre codici differenti.

Altre lingue