encoder | faire correspondre | noter

> match | rating | approach <

// MRA - Match Rating Approach pour la comparaison intelligente de noms

0 caractères
0 caractères
[SCORING]

Score de similarité

Calcule une similarité numérique entre les noms.

[6-CHAR]

Limite à 6 caractères

Codes optimisés avec les 3 premiers et les 3 derniers caractères.

[INTELLIGENT]

Correspondance intelligente

Ajuste le seuil en fonction de la longueur du nom.

>> informations techniques

Comment fonctionne Match Rating Approach

Match Rating Approach (MRA) est un algorithme phonétique développé par Western Airlines en 1977. Il encode les noms en supprimant les voyelles (sauf la première lettre), en éliminant les consonnes dupliquées et en réduisant le code à 6 caractères (3 premiers + 3 derniers si le nom est plus long). La phase de comparaison calcule la similarité en comparant les caractères depuis le début et la fin, avec un seuil ajusté en fonction de la longueur combinée des codes.

Pourquoi utiliser MRA ?

  • Plus précis que Soundex pour les variantes de noms
  • Système intégré de score de similarité
  • Gère les variations phonétiques et orthographiques
  • Utile pour la déduplication de bases de données
  • Efficace pour la recherche généalogique et le rapprochement de dossiers

Encodage et correspondance MRA

Étapes d'encodage :
1. Supprimer les voyelles (sauf la première)
2. Supprimer les consonnes dupliquées
3. Conserver les 3 premières + les 3 dernières si la longueur > 6

Exemples :
CATHERINE → CTHRN
  C[a]TH[e]R[i]N[e] → CTHRN

KATHERINE → KTHRN
  K[a]TH[e]R[i]N[e] → KTHRN

SMITH → SMTH
  SM[i]TH → SMTH

Seuils de correspondance :
Somme ≤ 4 : 5 correspondances nécessaires
Somme 5–7 : 4 correspondances nécessaires
Somme 8–11 : 3 correspondances nécessaires
Somme ≥ 12 : 2 correspondances nécessaires

CTHRN vs KTHRN :
Somme = 10, 3 correspondances nécessaires
Résultat : 4 correspondances → MATCH !

>> foire aux questions

Qu'est‑ce que Match Rating Approach ?

Match Rating Approach (MRA) est un algorithme phonétique développé par Western Airlines en 1977 pour la correspondance des noms de passagers. Il combine une phase d'encodage et une phase de comparaison et fournit à la fois un code phonétique et un score de similarité entre les noms.

En quoi MRA diffère‑t‑il des autres algorithmes phonétiques ?

Contrairement à Soundex ou Metaphone, qui ne fournissent que des codes, MRA inclut un algorithme de comparaison sophistiqué qui calcule des scores de similarité. Il ajuste le seuil de correspondance en fonction de la longueur des noms, ce qui le rend plus flexible et précis pour différents types de noms.

Que signifie le score de similarité ?

Le score de similarité compte le nombre de caractères identiques lors de la comparaison de deux codes MRA à partir du début et de la fin. Le score minimal requis varie selon la longueur combinée des codes — les noms plus courts nécessitent une similarité plus élevée pour être considérés comme correspondants.

Quand dois‑je utiliser MRA ?

MRA est idéal pour les applications nécessitant une correspondance fine des noms : bases de données clients, recherche généalogique, détection de fraude et rapprochement de dossiers. Il est particulièrement efficace pour identifier des doublons potentiels avec des orthographes différentes.

COPIÉ !