Actuellement, sur les réseaux sociaux, la sélection des actualités qui parviennent en continu, à mesure que l’internaute scrolle, est opérée par un algorithme de recommandation générique et indifférent au contenu. Il se fonde sur la similarité des informations consommées par le lecteur dans le passé ou par d’autres lecteurs qui lui sont proches. Il en résulte une uniformisation idéologique des contenus, aussi appelés « bulles d’opinions », qui enferme les lecteurs et polarise le débat public.
Destiné à favoriser un débat démocratique sain, le projet ANR BOOM « Modéliser et ouvrir les bulles d’opinion » souhaite proposer de nouveaux algorithmes de recommandations à destination de ces plateformes. La thèse d’Evan Dufraisse « Représentation hybride des thèmes polarisants dans les news politiques », codirigée par Julien Tourille et Adrian Popescu, vise la conception d’un nouveau système de recommandation plus vertueux, diversifiant les contenus auxquels les internautes ont accès.
Les travaux de recherche d’Evan Dufraisse ont pour objet le développement d’un algorithme de traitement du langage naturel (TALN) capable de favoriser cette diversification sans passer par une analyse manuelle du positionnement de chaque article de presse, une tâche qui serait impossible car trop coûteuse.
La difficulté est la suivante : le renouvellement constant des sujets abordés par les articles de presse ainsi que les variabilités temporelles et géographiques des idéologies et positionnements partisans, rend l’annotation des articles selon un axe gauche-droite difficile et peu généralisable. Une méthode plus universelle doit-être développée.
Il parvient dans un premier temps à l’aide de deux bases de données ouvertes à détecter automatiquement les entités politiquement affiliées au sein du texte et à les caractériser politiquement et démographiquement. L’utilisation de modèles de sentiment ciblés permettent dans un second temps de déterminer la manière avec laquelle ces entités sont représentées au sein du texte et à caractériser le positionnement éditorial des journaux dans la sphère médiatique française, ainsi que leurs différents biais de représentations. Cette caractérisation rend possible une meilleure diversification des points de vues présentés aux utilisateurs finaux.
Les travaux de recherche d’Evan Dufraisse sont donc un premier pas vers la création de nouveaux algorithmes de recommandation propices au développement de l’esprit critique des citoyens.
[1] Source ARCOM : rapport « Les Français et l’information », Mars 2024.