> match | rating | approach <
// MRA - Match Rating Approach voor slimme naamsvergelijking
Similariteitsscore
Berekent een numerieke similariteit tussen namen.
Limiet van 6 tekens
Geoptimaliseerde codes met de eerste 3 en laatste 3 tekens.
Slimme matching
Past de drempel aan op basis van de lengte van de naam.
>> technische info
Hoe Match Rating Approach werkt
Match Rating Approach (MRA) is een fonetisch algoritme dat in 1977 door Western Airlines is ontwikkeld. Het codeert namen door klinkers te verwijderen (behalve de eerste letter), dubbele medeklinkers te elimineren en het resultaat te verkorten tot 6 tekens (eerste 3 + laatste 3 als de naam langer is). In de vergelijkingsfase wordt de similariteit berekend door tekens vanaf het begin en het einde te vergelijken; de drempel wordt aangepast op basis van de gecombineerde lengte van de codes.
Waarom MRA gebruiken
- >Nauwkeuriger dan Soundex voor naamvarianten
- >Ingebouwd systeem voor similariteitsscores
- >Verwerkt zowel fonetische als spellingsvarianten
- >Geschikt voor deduplicatie van databases
- >Effectief voor genealogisch onderzoek en record‑linkage
MRA‑codering en ‑matching
Coderingsstappen:
1. Verwijder klinkers (behalve de eerste)
2. Verwijder dubbele medeklinkers
3. Bewaar de eerste 3 + laatste 3 als de lengte > 6 is
Voorbeelden:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
Match‑drempels:
Som ≤ 4: 5 overeenkomsten nodig
Som 5–7: 4 overeenkomsten nodig
Som 8–11: 3 overeenkomsten nodig
Som ≥ 12: 2 overeenkomsten nodig
CTHRN vs KTHRN:
Som = 10, minimaal 3 overeenkomsten
Resultaat: 4 overeenkomsten → MATCH!
>> veelgestelde vragen
Wat is Match Rating Approach?
Match Rating Approach (MRA) is een fonetisch algoritme dat in 1977 door Western Airlines is ontwikkeld voor het matchen van passagiersnamen. Het combineert een coderings‑ en vergelijkingsfase en levert zowel een fonetische code als een similariteitsscore tussen namen.
Hoe verschilt MRA van andere fonetische algoritmen?
In tegenstelling tot Soundex of Metaphone, die alleen codes leveren, bevat MRA een geavanceerd vergelijkingsalgoritme dat similariteitsscores berekent. De matchdrempel wordt aangepast op basis van de lengte van de naam, waardoor het flexibeler en nauwkeuriger is voor verschillende soorten namen.
Wat betekent de similariteitsscore?
De similariteitsscore telt het aantal overeenkomende tekens bij het vergelijken van twee MRA‑codes vanaf het begin en het einde. De minimaal vereiste score hangt af van de gecombineerde lengte van de codes — kortere namen vereisen een hogere similariteit om als match te worden beschouwd.
Wanneer moet ik MRA gebruiken?
MRA is ideaal voor toepassingen die verfijnde naamsmatching vereisen: klantdatabases, genealogisch onderzoek, fraudedetectie en het koppelen van records. Het is bijzonder nuttig bij het vinden van mogelijke duplicaten met verschillende schrijfwijzen.