> match | rating | approach <
// MRA - Match Rating Approach pour la comparaison intelligente de noms
Score de similarité
Calcule une similarité numérique entre les noms.
Limite à 6 caractères
Codes optimisés avec les 3 premiers et les 3 derniers caractères.
Correspondance intelligente
Ajuste le seuil en fonction de la longueur du nom.
>> informations techniques
Comment fonctionne Match Rating Approach
Match Rating Approach (MRA) est un algorithme phonétique développé par Western Airlines en 1977. Il encode les noms en supprimant les voyelles (sauf la première lettre), en éliminant les consonnes dupliquées et en réduisant le code à 6 caractères (3 premiers + 3 derniers si le nom est plus long). La phase de comparaison calcule la similarité en comparant les caractères depuis le début et la fin, avec un seuil ajusté en fonction de la longueur combinée des codes.
Pourquoi utiliser MRA ?
- >Plus précis que Soundex pour les variantes de noms
- >Système intégré de score de similarité
- >Gère les variations phonétiques et orthographiques
- >Utile pour la déduplication de bases de données
- >Efficace pour la recherche généalogique et le rapprochement de dossiers
Encodage et correspondance MRA
Étapes d'encodage :
1. Supprimer les voyelles (sauf la première)
2. Supprimer les consonnes dupliquées
3. Conserver les 3 premières + les 3 dernières si la longueur > 6
Exemples :
CATHERINE → CTHRN
C[a]TH[e]R[i]N[e] → CTHRN
KATHERINE → KTHRN
K[a]TH[e]R[i]N[e] → KTHRN
SMITH → SMTH
SM[i]TH → SMTH
Seuils de correspondance :
Somme ≤ 4 : 5 correspondances nécessaires
Somme 5–7 : 4 correspondances nécessaires
Somme 8–11 : 3 correspondances nécessaires
Somme ≥ 12 : 2 correspondances nécessaires
CTHRN vs KTHRN :
Somme = 10, 3 correspondances nécessaires
Résultat : 4 correspondances → MATCH !
>> foire aux questions
Qu'est‑ce que Match Rating Approach ?
Match Rating Approach (MRA) est un algorithme phonétique développé par Western Airlines en 1977 pour la correspondance des noms de passagers. Il combine une phase d'encodage et une phase de comparaison et fournit à la fois un code phonétique et un score de similarité entre les noms.
En quoi MRA diffère‑t‑il des autres algorithmes phonétiques ?
Contrairement à Soundex ou Metaphone, qui ne fournissent que des codes, MRA inclut un algorithme de comparaison sophistiqué qui calcule des scores de similarité. Il ajuste le seuil de correspondance en fonction de la longueur des noms, ce qui le rend plus flexible et précis pour différents types de noms.
Que signifie le score de similarité ?
Le score de similarité compte le nombre de caractères identiques lors de la comparaison de deux codes MRA à partir du début et de la fin. Le score minimal requis varie selon la longueur combinée des codes — les noms plus courts nécessitent une similarité plus élevée pour être considérés comme correspondants.
Quand dois‑je utiliser MRA ?
MRA est idéal pour les applications nécessitant une correspondance fine des noms : bases de données clients, recherche généalogique, détection de fraude et rapprochement de dossiers. Il est particulièrement efficace pour identifier des doublons potentiels avec des orthographes différentes.