> match | rating | approach <
// MRA - Match Rating Approach til intelligent sammenligning af navne
Lighedsscore
Beregner numerisk lighed mellem navne.
Begrænset til 6 tegn
Optimerede koder med de første 3 og sidste 3 tegn.
Intelligent matchning
Justerer tærsklen efter navnets længde.
>> tekniske oplysninger
Sådan fungerer Match Rating Approach
Match Rating Approach (MRA) er en fonetisk algoritme udviklet af Western Airlines i 1977. Den koder navne ved at fjerne vokaler (undtagen det første bogstav), fjerne dobbelte konsonanter og afkorte resultatet til 6 tegn (første 3 + sidste 3 hvis navnet er længere). I sammenligningsfasen beregnes lighed ved at sammenligne tegn både fra begyndelsen og slutningen, og tærsklen justeres ud fra den samlede længde af koderne.
Hvorfor bruge MRA?
- >Mere præcis end Soundex til navnevarianter
- >Indbygget system til lighedsscore
- >Håndterer både fonetiske og stavemæssige variationer
- >God til deduplikering af databaser
- >Effektiv til slægtsforskning og sammenkædning af poster
MRA‑kodning og matchning
Kodningstrin:
1. Fjern vokaler (undtagen den første)
2. Fjern dobbelte konsonanter
3. Behold første 3 + sidste 3 hvis længden > 6
Eksempler:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
Match‑tærskler:
Sum ≤ 4: kræver 5 match
Sum 5–7: kræver 4 match
Sum 8–11: kræver 3 match
Sum ≥ 12: kræver 2 match
CTHRN vs KTHRN:
Sum = 10, kræver 3 match
Faktisk: 4 match → MATCH!
>> ofte stillede spørgsmål
Hvad er Match Rating Approach?
Match Rating Approach (MRA) er en fonetisk algoritme udviklet af Western Airlines i 1977 til matchning af passagernavne. Den kombinerer en kodnings‑ og en sammenligningsfase og giver både en fonetisk kode og en lighedsscore mellem navne.
Hvordan adskiller MRA sig fra andre fonetiske algoritmer?
I modsætning til Soundex eller Metaphone, som kun giver koder, indeholder MRA en avanceret sammenligningsalgoritme, der beregner lighedsscore. Tærsklen for et match justeres efter navnets længde, hvilket gør algoritmen mere fleksibel og præcis.
Hvad betyder lighedsscoren?
Lighedsscoren er antallet af ens tegn, når to MRA‑koder sammenlignes fra både begyndelse og slutning. Den krævede minimumsscore afhænger af den samlede længde af koderne – kortere navne kræver højere lighed for at blive betragtet som et match.
Hvornår bør jeg bruge MRA?
MRA er ideel til applikationer, der kræver nuanceret navnematchning: kundebaser, slægtsforskning, svindelopdagelse og sammenkædning af registre. Den er især nyttig, når du skal finde potentielle dubletter med forskellige stavemåder.