Robots et influence sur les réseaux sociaux : la menace fantôme

Sur Twitter, les robots peuvent contribuer à infléchir le cours de l’opinion. Des experts en cybersécurité ont ainsi mis au jour un réseau de 350 000 robots interconnectés. L’occasion de faire le point sur les méthodes à disposition pour distinguer humains et programmes sur les réseaux sociaux.

INFLUENCE. On dénombrait, fin 2016, 317 millions d’utilisateurs par mois sur Twitter. Parmi eux, combien d’humains, combien de robots ? Le scénario semble relever de la science-fiction, et pourtant il n’en est rien : les robots influenceurs sont une réalité. Certains sont légitimes : outils de veille, ils republient automatiquement certains contenus. D’autres propagent spams et publicités. Mais il y a les bons bots, et les mauvais bots : ces derniers accomplissent des actions plus contestables en incitant à la radicalisation ou en relayant de fausses informations, autrement dit en polarisant artificiellement les opinions des twittoshumains. Une tendance appelée à se poursuivre : deux chercheurs en cybersécurité viennent de découvrir un botnet (voir encadré ci-dessous) de 350 000 comptes Twitter automatisés, à travers un travail prépublié disponible sur arXiv. Ces bots postaient en fait… des citations aléatoires issues de la saga Star Wars (!), ce qui a paradoxalement aidé à identifier la nature artificielle du réseau.


BOTNET. On parle de « botnet » (contraction de « robot » et « network » en anglais) lorsque des programmes connectés à Internet communiquent entre-eux. Le concept recoupe désormais aussi des machines infectées par un même virus ou logiciel malveillant les transformant en relais d’information.


Un réseau fantôme … écrivant sur Star Wars

Comment les chercheurs ont-il mis à jour un tel réseau fantôme ? Presque par hasard, en téléchargeant les informations relatives à un grand nombre de comptes Twitter anglophones. Or, les tweets peuvent être géolocalisés, permettant de savoir où a été envoyé le message… Et c’est là que nos deux experts en cybersécurité sont tombés sur un indice étrange : après avoir éliminé les messages émanant des zones les plus densément peuplées du globe, il leur restait 23 000 tweets dotées d’une étrange géolocalisation : ces derniers sont supposés avoir été envoyés depuis des régions inhabitables, comme l’océan ou des zones désertiques… ce qui témoigne d’un sacré « bidouillage » des coordonnées GPS. Représentées sur une carte, les localisations des messages forment deux quadrilatères bien définis au dessus des États-Unis et de l’Europe. L’objectif ? Gagner en légitimité et sembler plus vraisemblables aux yeux des internautes par des échanges outre-Atlantique, pensent les deux chercheurs.

Géolocalisation des tweets automatisés identifiés par les chercheurs / Crédits : Echeverria et Zhou 

STAR WARS. Ce réseau botnet, actif en juin 2013, a publié près de 150 000 tweets par jour durant sa brève période d’activité… et uniquement des citations issues de Star Wars. C’est d’ailleurs cette spécificité qui a permis aux chercheurs d’identifier pour de bon les 350 000 comptes automatisés, à l’aide d’un algorithme de machine learning identifiant les références à la saga Jedi. « La création de nouveaux bots semble s’être interrompue en juillet 2013, date depuis laquelle tous ces comptes n’ont plus rien posté », écrivent Escheverria et Zhou.

Des robots qui twittent sur Star Wars … l’anecdote peut prêter à sourire. Mais les chercheurs en voient surtout les menaces : « Le botnet Star Wars semble avoir été conçu de sorte à contourner délibérément les méthodes heuristiques permettant habituellement de détecter les robots sur les réseaux sociaux », avertissent-ils. Leur crainte : « Le réseau est aujourd’hui inactif, certainement parce que ces bots ont été vendus comme « followers » fantômes [ndlr : façon de gonfler artificiellement son audience sur Twitter en achetant des faux comptes]. Mais si quelqu’un rachetait tout le réseau et en reprenait subitement le contrôle ? »

L’habit fait-il le bot ?

L’identification des robots sur Twitter est un sujet pris très au sérieux par les spécialistes, dont la prestigieuse DARPA (Defense Advanced Research Project Agency) américaine. Cette dernière a récemment mené un concours entre différentes universités ou firmes spécialisées en cybersécurité, afin de déterminer les méthodes les plus à même de débusquer le robot noyé dans la masse des Twittos. Le projet a donné lieu à une publication dans IEE en juin 2016. « Identifier les robots présents sur les réseaux sociaux le plus tôt possible est important pour contrer les campagnes d’influence, et particulièrement dans les situations adverses« , écrivent le professeur Subrahmanian et son équipe. Difficile aujourd’hui de ne pas y voir une menace politique, de par les capacités d’influence de tels bots.


CRITÈRES. Comment reconnaître un tweetbot ? Plusieurs traits distinctifs peuvent être révélateurs… mais mauvaise nouvelle : elles restent l’apanage des experts et autres praticiens aguerris au machine learning. L’équipe ayant remporté le challenge de la DARPA (c’est à dire, ayant correctement identifié une liste de robots à partir de leurs interactions sur Twitter) a dû implémenter pas moins de 66 critères pour aboutir à ses fins, parmi les grandes catégories suivants :

– Syntaxe : Similarités de la syntaxe avec des programmes courant de traitement du langage naturel (comme Eliza), nombre moyen de mentions ou de hashtags par message, position des liens ou des hashtags… le caractère systématique de certains éléments en une position précise du message suggère une source automatisée (tweetbot).

 Sémantique : Autrement dit, la signification des messages postés, et dans quelle mesure ces derniers peuvent se contredire. Des techniques comme l’analyse de sentiments (opinion mining) permettent de juger la cohérence des messages postés.

– Chronologie : Comment évoluent les messages postés ou les métadonnées du profil (nombre de personnes suivies, etc) au cours du temps ? La distribution est plus aléatoire pour un humain, et plus facilement prédictible pour un robot.

– Profil : Y-a-t-il une image associée au profil Twitter, un site web ? Cette image vient-elle d’une banque d’images en ligne ? L’adresse du site web indiquée sur le profil est-elle la même que sur un autre profil ? Si oui, il est probable qu’on ait affaire à un robot.

– Comportement en réseau : Comment l’utilisateur se comporte-t-il par rapport aux utilisateurs qui le suivent ou qu’il suit ? S’agit-il plutôt d’un réseau pair à pair, ou d’un réseau en étoile ? Existe-t-il déjà d’autres robots dans le réseau de l’utilisateur ?


LEÇONS. Les organisateurs du concours ont tiré les leçons de l’expérience : « La détection de bots sur Twitter est un processus qui doit être semi-automatisé à partir de 4 grandes techniques : la détection des incohérences et la modélisation de comportements, l’analyse de textes, l’analyse de réseaux, et enfin l’apprentissage machine (machine learning) », concluent-ils. « Mais le principal enseignement reste que le tout doit être en partie supervisé par l’être humain. » Ainsi pour repérer l’attaque des clones sur Twitter, en définitive rien ne vaut l’œil d’épervier de l’être humain … mais secondé par les machines.

 

Sarah Sermondadaz

Source: sciencesetavenir.fr

 

Lamia Siffaoui
ADMINISTRATOR
PROFILE

Voir aussi

Laisser un commentaire

Votre adresse électronique ne sera pas publiée. Les champs Exigés sont marqués avec *

Cancel reply