// MRA - Match Rating Approach voor slimme naamsvergelijking
Berekent een numerieke similariteit tussen namen.
Geoptimaliseerde codes met de eerste 3 en laatste 3 tekens.
Past de drempel aan op basis van de lengte van de naam.
Match Rating Approach (MRA) is een fonetisch algoritme dat in 1977 door Western Airlines is ontwikkeld. Het codeert namen door klinkers te verwijderen (behalve de eerste letter), dubbele medeklinkers te elimineren en het resultaat te verkorten tot 6 tekens (eerste 3 + laatste 3 als de naam langer is). In de vergelijkingsfase wordt de similariteit berekend door tekens vanaf het begin en het einde te vergelijken; de drempel wordt aangepast op basis van de gecombineerde lengte van de codes.
Coderingsstappen:
1. Verwijder klinkers (behalve de eerste)
2. Verwijder dubbele medeklinkers
3. Bewaar de eerste 3 + laatste 3 als de lengte > 6 is
Voorbeelden:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
Match‑drempels:
Som ≤ 4: 5 overeenkomsten nodig
Som 5–7: 4 overeenkomsten nodig
Som 8–11: 3 overeenkomsten nodig
Som ≥ 12: 2 overeenkomsten nodig
CTHRN vs KTHRN:
Som = 10, minimaal 3 overeenkomsten
Resultaat: 4 overeenkomsten → MATCH!
Match Rating Approach (MRA) is een fonetisch algoritme dat in 1977 door Western Airlines is ontwikkeld voor het matchen van passagiersnamen. Het combineert een coderings‑ en vergelijkingsfase en levert zowel een fonetische code als een similariteitsscore tussen namen.
In tegenstelling tot Soundex of Metaphone, die alleen codes leveren, bevat MRA een geavanceerd vergelijkingsalgoritme dat similariteitsscores berekent. De matchdrempel wordt aangepast op basis van de lengte van de naam, waardoor het flexibeler en nauwkeuriger is voor verschillende soorten namen.
De similariteitsscore telt het aantal overeenkomende tekens bij het vergelijken van twee MRA‑codes vanaf het begin en het einde. De minimaal vereiste score hangt af van de gecombineerde lengte van de codes — kortere namen vereisen een hogere similariteit om als match te worden beschouwd.
MRA is ideaal voor toepassingen die verfijnde naamsmatching vereisen: klantdatabases, genealogisch onderzoek, fraudedetectie en het koppelen van records. Het is bijzonder nuttig bij het vinden van mogelijke duplicaten met verschillende schrijfwijzen.