L’appariement (littéralement la constitution de paires) entre deux personnes est la méthode de base de détection des personnes sous sanction.
Pour les personnes frappées de gel des avoirs, il faut trouver « qui dans ses relations d’affaires » est présent dans une liste de sanctions. Il s’agit donc de :
- rechercher dans une ou plusieurs listes de personnes sous sanction la présence de relations d’affaires
ou
- rechercher dans son fichier de relations d’affaires la présence d’une ou de plusieurs personnes qui figurent dans une liste de sanctions.
Pour systématiser ses recherches, il faut appliquer une méthode d’appariement qui consiste à unir des paires.
Dans le domaine du gel des avoirs, la paire est constituée d’une part par une personne sous sanction qui figure dans une liste officielle, et d’autre part par une relation d’affaires (clients, payeur, adhérent, prospect, …).
Et pour chaque paire constituée, il faut déterminer si la personne présente de chaque côté de la paire est la même. Dans ce cas, elle sera qualifiée de « vrai positif ». Ainsi, toute paire non retenue sera qualifiée de « faux positif » ou « vrai négatif ».
Que faut-il faire pour constituer des paires « de personnes » ? La première réponse qui vient à l’esprit est de faire une comparaison exacte des éléments constitutifs de l’identité de la personne, par exemple une comparaison exacte des noms, prénoms et dates de naissance.
Mais comparaison exacte ne signifie pas pertinence pour plusieurs raisons :
- L’exact matching n’est pas accepté par la réglementation1.
- Des critères orthographiques trop restrictifs dans le paramétrage de l’outil de filtrage ne permettent pas une détection efficace des opérations au profit des personnes ou entités désignées. Les organismes financiers s’assurent donc que leur outil de filtrage ne repose pas sur une fonction de rapprochement de type « exact match ». Ils sont invités à définir un taux de concordance qui permet de détecter les différentes variations orthographiques des éléments d’identification des personnes ou entités désignées en particulier lorsque celles-ci sont issues de langues ou d’alphabets étrangers.
- Les données d’état civil peuvent être incomplètes ou peu fiables2. Les données de personnes sous sanction sont souvent incomplètes et parfois non vérifiables (nous pensons ici aux dates de naissance).
- Des erreurs peuvent intervenir au moment du relevé de l’identité : erreurs typographiques, erreurs phonétiques, prise en compte de surnoms ou d’alias,
- Des difficultés particulières peuvent apparaitre lorsqu’il est nécessaire de changer d’alphabets l’une des deux identités de la paire, voire des deux.
Il faut donc utiliser d’autres méthodes de comparaisons applicables aux noms, prénoms et dates de naissance.
Au-delà du secteur de la criminalité financière, les besoins dans de nombreux secteurs d’activités ont permis de faire émerger de nombreuses techniques pouvant être classées dans 3 familles :
- La famille des distances d’édition : les distances d’édition permettent de comparer deux mots entre eux, ou plus généralement deux séquences de symboles entre elles. Les méthodes les plus connues étant la méthode de Levenshtein et la méthode de Jaro-Winckler.
- La famille des techniques phonétiques : l’objectif est que les noms ayant la même prononciation soient codés avec la même chaîne de manière à pouvoir trouver une correspondance entre eux. Les méthodes les plus connues sont la méthode de Soundex et la méthode Métaphone.
- La famille des techniques de règles : l’objectif est de s’appuyer sur un référentiel de règles qui permet d’associer des noms et/ou prénoms. Il peut s’agir de dictionnaires pour trouver les diminutifs d’un prénom, ou encore des règles de latinisation ou romanisation permettant de transcrire un mot dans une langue utilisant un alphabet autre vers une écriture latine. Enfin, il peut s’agir d’utiliser des règles prédéfinies (comme ignorer les espaces, la casse, ou les titres).
De nombreuses études ont recherché dans différents contextes, à évaluer ces différentes méthodes et à construire des classements permettant aux utilisateurs de choisir sinon la meilleure méthode, tout au moins la ou les méthodes les plus appropriées.
Retenons dans ces circonstances que les techniques mixtes de « name matching » qui combinent plusieurs approches d’appariement de noms, sont très efficaces dans de nombreuses situations.
Démonstration :
- Complémentarité des Techniques :
Chaque technique d’appariement de noms a ses forces et ses faiblesses. En les combinant, on peut tirer parti des avantages de chacune, ce qui augmente la probabilité de trouver un match correct. - Flexibilité et Robustesse :
Les techniques mixtes offrent une plus grande flexibilité et robustesse, en particulier dans les cas où les données sont imparfaites, incomplètes ou sujettes à des variations. - Amélioration de la Précision :
En utilisant plusieurs méthodes, il est possible de réduire les faux positifs (matches incorrects) et les faux négatifs (matches manqués), améliorant ainsi la précision globale du processus de matching. - Adaptabilité :
Les techniques mixtes peuvent être plus facilement adaptées à des contextes spécifiques, comme des différences linguistiques ou culturelles, qui peuvent affecter la façon dont les noms sont écrits ou prononcés. - Traitement de cas complexes :
Certaines situations de matching de noms peuvent être très complexes (par exemple, des noms très communs ou des noms avec de nombreuses variantes). Les approches mixtes sont souvent plus efficaces pour gérer ces complexités. - Utilisation des Avancées Technologiques :
Le mix de techniques basées sur l’IA et le machine learning avec des méthodes plus traditionnelles optimise le traitement de données et d’analyse ainsi que le temps nécessaire à ces tâches.
En conclusion, le recours à des techniques de « name matching » ou « name screening » est absolument nécessaire pour répondre aux exigences d’identification des personnes frappées de gel de avoirs.
Cet article est issu de notre livre blanc 2024, co-signé avec Astrée Avocats.
Il est téléchargeable depuis la page d’accueil de notre site.
1 : Considérant 72 – Lignes directrices conjointes de la Direction Générale du Trésor et de l’Autorité de contrôle prudentiel et de résolution sur la mise en œuvre des mesures de gel des avoirs
2 : Selon la banque mondiale environ 850 millions de personnes dans le monde ne disposent pas d’une forme officielle d’identification