> soundex | fonetisk | fuzzy <
// Soundex – fonetisk algoritm för att indexera namn efter ljud
Ljudbaserad
Kodar namn baserat på uttal i stället för stavning.
Fuzzy‑matchning
Hittar namn som låter lika även om de stavas olika.
Släktforskning
Ett viktigt verktyg för släktforskning och historiska arkiv.
>> teknisk info
Hur Soundex fungerar:
Soundex behåller den första bokstaven och ersätter konsonanter med siffror baserat på fonetiska grupper. Konsonanter som låter lika får samma siffra; vokaler ignoreras och resultatet fylls ut eller kapas till 4 tecken (American) eller en variabel längd (Refined).
Kodningsregler:
1 = B,F,P,V 2 = C,G,J,K,Q,S,X,Z 3 = D,T 4 = L 5 = M,N 6 = R Robert → R163 Rupert → R163 Rubin → R150
Varför använda Soundex?:
- >Ta bort dubbletter i databaser
- >Släkt‑ och familjeforskning
- >Analys av folkbokföring och censuser
- >Matchning av kunddata
- >Stavningskontroll och rättning
>> vanliga frågor
Vad är Soundex?
Soundex är en fonetisk algoritm från 1918 för att indexera namn efter hur de låter. Den utvecklades för den amerikanska folkräkningen för att göra det enklare att hitta efternamn med liknande uttal trots olika stavning.
American vs. Refined Soundex?
American Soundex skapar koder med fyra tecken (en bokstav + tre siffror). Refined Soundex (som används t.ex. i SQL Server) använder fler kodningsgrupper och koder med variabel längd för högre precision.
Varför får olika stavningar samma kod?
Det är hela poängen med Soundex. Algoritmen grupperar namn som låter lika – som Smith och Schmidt – så att du lättare hittar olika varianter av samma namn i en databas.
Vilka begränsningar har Soundex?
Soundex fungerar bäst för engelska namn. För andra språk kan träffsäkerheten vara lägre, och mycket olika stavningar av samma namn kan ge olika koder.