> soundex | fonetisk | fuzzy <

// Soundex – fonetisk algoritme til at indeksere navne efter lyd

[PHONETIC]

Lyd‑baseret

Koder navne efter udtale i stedet for stavemåde.

[FUZZY]

Fuzzy‑matching

Finder navne der lyder ens, selv med forskellig stavning.

[GENEALOGY]

Slægtsforskning

Uundværligt værktøj til slægtsforskning og historiske arkiver.

>> tekniske detaljer

Sådan fungerer Soundex:

Soundex beholder det første bogstav og erstatter konsonanter med cifre baseret på fonetiske grupper. Lignende konsonanter får samme tal, vokaler ignoreres, og resultatet polstres eller afkortes til 4 tegn (American) eller variabel længde (Refined).

Kodningsregler:

1 = B,F,P,V 2 = C,G,J,K,Q,S,X,Z 3 = D,T 4 = L 5 = M,N 6 = R Robert → R163 Rupert → R163 Rubin → R150

Hvorfor bruge Soundex?:

  • >Fjernelse af dubletter i databaser
  • >Slægtsforskning
  • >Analyse af folketællinger
  • >Kundematching
  • >Stavekorrektion

>> ofte stillede spørgsmål

Hvad er Soundex?

Soundex er en fonetisk algoritme fra 1918 til at indeksere navne efter lyd. Den blev udviklet til den amerikanske folketælling for at gøre det lettere at finde efternavne med lignende udtale på trods af forskellig stavning.

American vs. Refined Soundex?

American Soundex producerer koder på 4 tegn (bogstav + 3 cifre). Refined Soundex (brugt bl.a. i SQL Server) bruger flere kodningsgrupper og variable længder for mere præcise resultater.

Hvorfor får forskellige stavemåder samme kode?

Det er hele pointen! Soundex grupperer navne, der lyder ens. Smith og Schmidt lyder næsten ens og får derfor lignende koder, så du kan finde variationer af det samme navn.

Hvilke begrænsninger har Soundex?

Soundex fungerer bedst med engelske navne. Det kan være mindre præcist for andre sprog, og meget forskellige stavemåder kan stadig ende med forskellige koder.

Andre sprog