> match | rating | approach <
// MRA - Match Rating Approach für intelligente Namensvergleiche
Ähnlichkeitsscore
Berechnet eine numerische Ähnlichkeit zwischen Namen.
Begrenzung auf 6 Zeichen
Optimierte Codes mit den ersten 3 und letzten 3 Zeichen.
Intelligentes Matching
Passt die Schwelle an die Namenslänge an.
>> Technische Infos
Funktionsweise von Match Rating Approach
Match Rating Approach (MRA) ist ein phonetischer Algorithmus, der 1977 von Western Airlines entwickelt wurde. Er kodiert Namen, indem Vokale (außer dem ersten Buchstaben) entfernt, doppelte Konsonanten eliminiert und der Code auf 6 Zeichen gekürzt wird (erste 3 + letzte 3 bei längeren Namen). In der Vergleichsphase wird die Ähnlichkeit berechnet, indem Zeichen von Anfang und Ende verglichen werden; die Match‑Schwelle wird anhand der kombinierten Codelänge angepasst.
Warum MRA verwenden?
- >Genauer als Soundex bei Namensvarianten
- >Integriertes System für Ähnlichkeitsscores
- >Verarbeitet sowohl phonetische als auch orthografische Varianten
- >Geeignet zur Deduplikation von Datenbanken
- >Effektiv für genealogische Forschung und Record‑Linkage
MRA‑Kodierung & Matching
Kodierschritte:
1. Vokale entfernen (außer dem ersten)
2. Doppelte Konsonanten entfernen
3. Erste 3 + letzte 3 Zeichen behalten, wenn Länge > 6
Beispiele:
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
Match‑Schwellen:
Summe ≤ 4: 5 Übereinstimmungen erforderlich
Summe 5–7: 4 Übereinstimmungen erforderlich
Summe 8–11: 3 Übereinstimmungen erforderlich
Summe ≥ 12: 2 Übereinstimmungen erforderlich
CTHRN vs KTHRN:
Summe = 10, benötigt 3 Übereinstimmungen
Tatsächlich: 4 Übereinstimmungen → MATCH!
>> Häufig gestellte Fragen
Was ist Match Rating Approach?
Match Rating Approach (MRA) ist ein phonetischer Algorithmus, der 1977 von Western Airlines zur Abgleichung von Passagiernamen entwickelt wurde. Er kombiniert Kodierungs‑ und Vergleichsphase und liefert sowohl einen phonetischen Code als auch einen Ähnlichkeitsscore zwischen Namen.
Wodurch unterscheidet sich MRA von anderen phonetischen Algorithmen?
Im Gegensatz zu Soundex oder Metaphone, die nur Codes erzeugen, enthält MRA einen ausgefeilten Vergleichsalgorithmus, der Ähnlichkeitsscores berechnet. Die benötigte Schwelle für ein Match wird anhand der Namenslänge angepasst, wodurch MRA flexibler und genauer ist.
Was bedeutet der Ähnlichkeitsscore?
Der Ähnlichkeitsscore zählt die Anzahl übereinstimmender Zeichen beim Vergleich zweier MRA‑Codes vom Anfang und vom Ende. Die erforderliche Mindestpunktzahl hängt von der kombinierten Codelänge ab – kürzere Namen benötigen eine höhere Ähnlichkeit, um als Treffer zu gelten.
Wann sollte ich MRA verwenden?
MRA eignet sich für Anwendungen, die einen fein abgestuften Namensabgleich benötigen: Kundendatenbanken, genealogische Forschung, Betrugserkennung und Verknüpfung von Datensätzen. Besonders hilfreich ist es beim Erkennen potenzieller Duplikate mit unterschiedlichen Schreibweisen.