// MRA - Match Rating Approach pour la comparaison intelligente de noms
Calcule une similarité numérique entre les noms.
Codes optimisés avec les 3 premiers et les 3 derniers caractères.
Ajuste le seuil en fonction de la longueur du nom.
Match Rating Approach (MRA) est un algorithme phonétique développé par Western Airlines en 1977. Il encode les noms en supprimant les voyelles (sauf la première lettre), en éliminant les consonnes dupliquées et en réduisant le code à 6 caractères (3 premiers + 3 derniers si le nom est plus long). La phase de comparaison calcule la similarité en comparant les caractères depuis le début et la fin, avec un seuil ajusté en fonction de la longueur combinée des codes.
Étapes d'encodage :
1. Supprimer les voyelles (sauf la première)
2. Supprimer les consonnes dupliquées
3. Conserver les 3 premières + les 3 dernières si la longueur > 6
Exemples :
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
Seuils de correspondance :
Somme ≤ 4 : 5 correspondances nécessaires
Somme 5–7 : 4 correspondances nécessaires
Somme 8–11 : 3 correspondances nécessaires
Somme ≥ 12 : 2 correspondances nécessaires
CTHRN vs KTHRN :
Somme = 10, 3 correspondances nécessaires
Résultat : 4 correspondances → MATCH !
Match Rating Approach (MRA) est un algorithme phonétique développé par Western Airlines en 1977 pour la correspondance des noms de passagers. Il combine une phase d'encodage et une phase de comparaison et fournit à la fois un code phonétique et un score de similarité entre les noms.
Contrairement à Soundex ou Metaphone, qui ne fournissent que des codes, MRA inclut un algorithme de comparaison sophistiqué qui calcule des scores de similarité. Il ajuste le seuil de correspondance en fonction de la longueur des noms, ce qui le rend plus flexible et précis pour différents types de noms.
Le score de similarité compte le nombre de caractères identiques lors de la comparaison de deux codes MRA à partir du début et de la fin. Le score minimal requis varie selon la longueur combinée des codes — les noms plus courts nécessitent une similarité plus élevée pour être considérés comme correspondants.
MRA est idéal pour les applications nécessitant une correspondance fine des noms : bases de données clients, recherche généalogique, détection de fraude et rapprochement de dossiers. Il est particulièrement efficace pour identifier des doublons potentiels avec des orthographes différentes.