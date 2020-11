Des électeurs américains à Ravenna, dans l'Ohio, le 29 octobre 2020. Keystone / David Maxwell

Deux équipes suisses de chercheurs ont élaboré des modèles de données qui prédisent une victoire de Donald Trump à la présidentielle américaine mardi. Basés notamment sur l’analyse des discours et des recherches sur internet, ces deux modèles avaient déjà annoncé l’élection du Républicain en 2016.

03 novembre 2020

Les pronostics des chercheurs suisses pour l’élection présidentielle aux États-Unis vont à l’encontre de nombreux sondages donnant le candidat démocrate Joe Biden en tête avec des marges confortables.

L’une des équipes a utilisé les recherches sur Internet et les réseaux sociaux pour évaluer l’intérêt porté aux candidats. L’autre a modifié un système prédictif existant, basé sur des données économiques et le bilan du président sortant de sorte que le charisme des candidats soit aussi pris en compte.

«J’ai vraiment eu l’impression d’être le seul idiot sur la planète, avec peut-être une ou deux autres équipes de recherche, à dire que Donald Trump l’emporterait [en 2016]», se souvient John Antonakis, professeur de comportement organisationnel à l’Université de Lausanne.

Avec Philippe Jacquart, professeur à l’EM Lyon, une école de management française, John Antonakis avait prédit le résultat de l’élection en se fondant sur le charisme du candidat. «Je pensais vraiment qu’il y avait quelque chose de fondamentalement faux [dans notre méthode]», raconte-t-il.

Le problème des sondages

Les deux groupes de chercheurs estiment que les sondages se heurtent à plusieurs obstacles lorsqu’il s’agit de se faire une image précise de l’électorat. Avec le passage des téléphones fixes aux portables, il est plus difficile de contacter un échantillon représentatif de votants. Ils évoquent aussi le fait que les sondés ne sont pas forcément sincères dans leurs réponses, ou encore le fait que les répondants ne vont pas tous voter.

Les sondeurs «sont des statisticiens sérieux mais ils ont un problème très épineux à régler», relève John Antonakis.

Christoph Glauser est politologue et spécialiste des médias. Il dit avoir commencé à pointer la difficulté d’obtenir des sondages fiables il y a au moins 15 ans. Il est le fondateur de l’Institut pour la recherche appliquée d’arguments (IFAA), un centre de recherche privé basé à Berne, qui crée des systèmes informatiques dédiés à l’analyse des médias numériques et des contenus en ligne.

Christoph Glauser, son assistant de recherche Loris Schmid et Jacques Savoy, professeur en science informatique à l’Université de Neuchâtel, ont mis sur pied une équipe composée de scientifiques, d’économistes, d’experts des données, de spécialistes en informatique et de psychologues. Ils ont élaboré une méthode d’évaluation des candidats basée sur les recherches Internet et leur présence sur les réseaux sociaux.

Le manque de fiabilité des sondages «est la raison pour laquelle nous avons commencé à développer des API (interfaces de programmation d’application) afin d’analyser ce que les internautes recherchent sur le web, explique-t-il. Il s’agit de petits logiciels qui analysent, par exemple, ce que les gens recherchent réellement sur Google, Twitter et Facebook.»

Ce que racontent les recherches sur Internet

Les serveurs des scientifiques scannent le web et collectent d’innombrables quantités de données portant sur les recherches, les achats en ligne et l’activité sur les réseaux sociaux de 247 millions d’internautes aux États-Unis. Ils recueillent également des données sur les candidats dans le monde entier.

D’après Christoph Glauser, les données utilisées pour l’analyse de la présidentielle 2020 proviennent de 367 canaux aux États-Unis — parmi lesquels les moteurs de recherche, les réseaux sociaux et les sites de e-commerce — ainsi que de 14’103 canaux en dehors du pays. Outre les recherches sur chacun des deux candidats, l’équipe a suivi plus de 2500 thématiques susceptibles d’intéresser la population, telles que le contrôle des armes à feu, le mouvement «Black Lives Matter», la Cour suprême et la pandémie de Covid-19.

«Le [volume de recherches sur un candidat] donne une idée de la force de la campagne, dévoile Christoph Glauser. Nous vivons en quelque sorte dans une économie de l’attention. Si vous avez l’attention et que vous obtenez en retour des réactions actives des utilisateurs, il est probable que vous soyez davantage présent dans l’esprit des électeurs.»

En elles-mêmes, les recherches sur le web ne disent pas si les informations sont favorables ou défavorables à un candidat. On ignore aussi si elles sont utilisées par pur intérêt ou à des fins de recherche. Mais, explique Christoph Glauser, la favorabilité est corrélée aux volumes de recherches.

«Lorsque vous disposez de très grands ensembles de données comme nous, provenant de tous les canaux [pertinents], vous pouvez identifier des tendances et cela facilite les prévisions», déclare-t-il.

Davantage de recherches concernent Donald Trump

L’équipe a mesuré le volume mensuel moyen des recherches sur tous les canaux américains. Elle a constaté que Donald Trump avait fait l’objet d’environ 70 millions de recherches pendant la majeure partie de la campagne. Ce nombre a grimpé à 100 millions avec le tweet dans lequel le président américain révélait avoir été testé positif au coronavirus.

À son plus haut, le volume des recherches sur Joe Biden n’a atteint que 26,6 millions en septembre. À cinq jours de l’élection, Christoph Glauser affirme que ces chiffres ont augmenté dans les deux camps, mais que ces hausses ne sont pas de nature à modifier la prédiction de son équipe quant à une victoire de Donald Trump.

Le projet a par ailleurs évalué l’engagement sur Twitter. Le partenaire de recherche de Christoph Glauser, Jacques Savoy, s’est particulièrement intéressé à cette question, car il est spécialiste de la linguistique et du discours politique, aux États-Unis notamment.

Habituellement, Jacques Savoy analyse les formes écrites et orales du discours politique, mais Twitter pose de nouveaux enjeux. «On n’est pas sur une forme écrite, c’est moins formel, mais ce n’est pas non plus la forme orale. C’est quelque chose entre les deux», analyse-t-il.

Il a constaté que Donald Trump et son équipe ont pu envoyer 43 tweets par jour, contre 11 pour Joe Biden. Donald Trump est également beaucoup plus suivi sur Twitter, avec 87 millions de followers contre environ 11 millions pour Joe Biden.

«Lorsque Donald Trump envoie un tweet, il est clairement plus visible, indique Jacques Savoy. Il est donc plus fréquent de voir des arguments en faveur de Donald Trump sur le réseau social. Est-ce que cela va vraiment correspondre aux électeurs? La question est ouverte.»

Christophe Glauser développe sa méthode depuis une vingtaine d’années et l’utilise pour évaluer une cinquantaine d’élections dans le monde. Il a commencé à faire des pronostics il y a trois ans, et s’est prononcé depuis sur une dizaine de scrutins. En comparant le pourcentage de voix reçues par les candidats au pourcentage du volume de recherches, ses prédictions suivent de près les résultats, généralement dans une fourchette de 1 à 5%, assure-t-il. Tandis que les sondages sont beaucoup plus éloignés du résultat, parfois jusqu’à 40%.

Evaluer le charisme des candidats

La deuxième équipe de recherche menée en Suisse par John Antonakis et Philippe Jacquart a mis au point un programme informatique pour évaluer le charisme d’un candidat, c’est-à-dire l’attrait qu’il exerce sur les électeurs à un niveau personnel.

Pendant son séjour à l’Université de Yale, John Antonakis a pris connaissance d’un modèle prédictif élaboré par l’économiste Ray Fair. Pour prédire le résultat des élections présidentielles américaines, le modèle de Ray Fair postule que les candidats sortants ont un avantage, que les électeurs seront lassés d’un parti politique après deux mandats de quatre ans, et qu’un candidat sortant sera jugé sur la force ou la faiblesse de l’économie. Mais il manquait quelque chose, pointe John Antonakis.

«Ce modèle ne tient pas compte des différences entre les deux candidats, développe-t-il. Il part du principe que chaque parti a mis en avant la personne la plus compétente.»

Des études suggèrent que les électeurs jugent la compétence d’un candidat à son visage. Mais John Antonakis ne pouvait pas accepter l’idée que le sort de la gouvernance repose sur l’apparence d’une personne. Il a donc exploré la notion de charisme, et développé un «charismomètre»: une méthode objective d’analyse du discours d’un candidat selon différents traits charismatiques.

Le charisme est important parce qu’il signale des valeurs et des points forts aux partisans potentiels, ainsi qu’une possible menace pour la partie adverse, explique John Antonakis. Dans son modèle, l’estimation du charisme du candidat est ajoutée au modèle traditionnel de Ray Fair afin de prédire le résultat.

Qui a l'avantage?

Selon John Antonakis, si Donald Trump a un avantage en tant que président sortant, les perspectives économiques difficiles cette année en raison de la pandémie de Covid-19 donnent un léger avantage à Joe Biden, selon le modèle Fair. Mais, selon le modèle d’Antonakis, Donald Trump a plus de charisme et apparaît comme le favori.

Le «charismomètre» a correctement prédit l’issue des élections de 2012 et 2016. Et lorsque les chercheurs ont appliqué la méthode aux élections passées, le modèle a correctement prédit les résultats de 20 scrutins sur 24. Selon John Antonakis, une seule chose pourrait affecter sa prédiction d’une victoire de Donald Trump: les chiffres particulièrement mauvais de l’économie américaine publiés avant l’élection. Au 29 octobre, les chiffres du PIB correspondaient aux attentes.

John Antonakis souligne que le charisme est subjectif, et relatif à l’auditoire d’un orateur. Par exemple, l’ancien président Barack Obama serait probablement considéré comme charismatique par les membres du parti démocrate, mais pas par les membres du parti républicain. Une personne est en effet souvent jugée charismatique si ses valeurs sont alignées avec celles de son public.

Le «charismomètre» tente d’éliminer ce jugement de valeur et de déterminer le charisme selon la définition de John Antonakis: «l’envoi de signaux de leadership à la fois symboliques, émotionnels et basés sur des valeurs.» «Je veux que la machine me dise, quelles que soient mes valeurs, si cette personne est charismatique ou non», résume le chercheur.

Comment fonctionne le «charismomètre»

Le «charismomètre» évalue le discours sur la base de neuf éléments, notamment l’identification et l’expression de la confiance dans les objectifs, l’utilisation de listes en trois parties, l’utilisation de métaphores et d’histoires, et le fait de poser des questions rhétoriques.

Pour évaluer un candidat, John Antonakis copie et colle un discours dans un champ de son écran d’ordinateur. Le programme évalue ensuite les phrases du discours en fonction de chacun des neuf éléments. Puis il calcule la probabilité que l’orateur soit charismatique.

Par exemple, en se basant sur le discours de Gettysburg prononcé par Abraham Lincoln en 1863, le programme a estimé à 80% la probabilité que Lincoln soit charismatique. Dans les discours d’acceptation des candidats à l’investiture présidentielle entre 1916 et 2016, il y avait en moyenne 30% de probabilité que le candidat soit charismatique. Avec son discours d’acceptation, Donald Trump a été évalué à 55,6% alors que Joe Biden était à 52%.

John Antonakis émet toutefois une réserve, qui sera le facteur déterminant mardi. «La question est de savoir si une personne qui communique de cette manière parvient à galvaniser la base du parti au point de la faire voter.»

Traduction de l'anglais: Pauline Turuban