> refined | soundex | encoder <
// Refined Soundex - forbedret fonetisk kodning med flere varianter
Højere nøjagtighed
Mere præcis end den klassiske Soundex-algoritme.
Flere varianter
Understøtter Refined-, Apache- og SQL Server-versioner.
Fonetisk matching
Grupperer konsonanter der lyder ens på en intelligent måde.
>> teknisk info
Sådan fungerer Refined Soundex
Refined Soundex forbedrer den originale Soundex-algoritme ved at bruge mere detaljerede tegnmappinger, der bedre opfanger fonetiske ligheder. Den beholder det første bogstav og koder de efterfølgende konsonanter som talgrupper baseret på deres lyd. Algoritmen tilbyder tre varianter: den standardiserede Refined-version, Apache Commons-implementeringen og en variant der matcher SQL Servers SOUNDEX-funktion.
Hvorfor bruge Refined Soundex?
- Bedre nøjagtighed end standard Soundex
- Flere varianter til forskellige systemer
- Forbedret gruppering af konsonanter
- Bevarer bagudkompatibilitet
- Databasevenlig kodning
Refined Soundex-eksempler
Encoding process:
1. Keep first letter
2. Map consonants to digits
3. Remove duplicates
4. Pad with zeros to length
Refined mappings:
B,P → 1
F,V → 2
C,K,S → 3
G,J → 4
Q,X,Z → 5
D,T → 6
L → 7
M,N → 8
R → 9
Examples:
THOMPSON → T81938
T-H[0]-O-M[8]-P[1]-S[9]-O-N[3][8]
JACKSON → J23938
J-A-C[2]-K[3]-S[9]-O-N[3][8]
Apache variant:
Additional mappings for W,Y
SQL variant:
Original Soundex mappings
>> ofte stillede spørgsmål
Hvad er Refined Soundex?
Refined Soundex er en udvidet version af den oprindelige Soundex-algoritme, som giver mere præcis fonetisk kodning af navne. Den bruger forbedrede konsonantmappinger der bedre afspejler den faktiske udtale.
Hvordan adskiller den sig fra standard Soundex?
Refined Soundex bruger flere talgrupper (0–9 i stedet for 0–6) og mere sofistikerede konsonantmappinger. For eksempel adskiller den M og N i forskellige koder og skelner mellem flere konsonantlyde end den oprindelige algoritme.
Hvilken variant skal jeg bruge?
Brug den almindelige Refined-variant for bedst nøjagtighed. Vælg Apache-varianten hvis du har brug for kompatibilitet med Apache Commons Codec-biblioteket. Brug SQL Server-varianten når du matcher mod SQL Servers SOUNDEX-funktion.
Er Refined Soundex bedre til alle navne?
Refined Soundex giver generelt bedre nøjagtighed for engelske navne, især når forskellene i udtale er små. For ikke-engelske navne eller særlige brugssituationer kan algoritmer som Double Metaphone eller Daitch-Mokotoff være mere velegnede.