analyse

L'intelligence artificielle, c'est con comme un manche

Plusieurs experts mettent en garde contre une utilisation aveugle des données du contact tracing et estiment que le facteur humain reste primordial pour éviter une nouvelle vague de contamination au coronavirus. ©EPA

Le contact tracing pour lutter contre le coronavirus n’est pas la panacée. Dans l’histoire des virus et de l’intelligence artificielle, les comportements humains ont trop souvent été écartés. Quand le big data n'est pas parole d’évangile.

Ils pouvaient en être fiers. En mars 2014, un algorithme avait réussi à détecter l’épidémie d’Ebola en Sierra Leone neuf jours avant l’Organisation mondiale de la santé. Émanation du Boston Children’s Hospital, la société américaine HealthMap avait plongé dans l’immense vivier de données drainées sur Internet: réseaux sociaux, articles de presse, organisations de santé, blogs… De ces données et grâce à l’intelligence artificielle, l’entreprise avait pu identifier une "fièvre hémorragique mystérieuse", qui s’est ensuite apparentée au fameux virus Ebola qui a provoqué la mort de plusieurs milliers de personnes dans la région.

HealthMap n’est pas la seule. Plus récemment, c’est encore un algorithme, celui de la société canadienne BlueDot, qui a réussi la même performance en détectant avant tout le monde l’apparition du SARS-CoV-2, le coronavirus responsable du Covid-19. Mieux encore: en utilisant les données des zones infectées et en les combinant avec les données des transports aériens, l’entreprise se targue d’avoir pu prédire où le virus allait resurgir et quand.

Tout savoir sur le coronavirus Covid-19

La pandémie de coronavirus Covid-19 frappe de plein fouet la vie quotidienne des Belges et l'économie. Quel est l'impact du virus sur votre santé et sur votre portefeuille? Les dernières informations et les analyses dans notre dossier. 

Par thématique:

L’intelligence artificielle, notre meilleur espoir pour combattre la pandémie? Au-delà des débats sur l’intrusion de cette technologie dans nos vies privées, il est bon de la remettre à la place qui lui convient: celle d’un simple outil placé sur une étagère des possibles, à utiliser avec la plus grande prudence.

Les limites du big data...

Car derrière la communication bien huilée de HealthMap, se cacherait une réalité toute autre qui illustre bien les limites du big data (ou mégadonnées). Susan Erikson, professeure des sciences de la santé à l’université canadienne Simon Fraser, était présente sur place au moment des faits. Dans un article publié en 2018 dans l’International Journal for the Analysis of Health, elle précise d’abord que l’annonce d’une possible présence d’un virus comme Ebola était dans les médias locaux dès février, un mois avant l’annonce d’HealthMap.

"Le plus grand coup porté aux affirmations de la suprématie algorithmique de HealthMap est le simple fait qu'une éclosion de maladie doit d'abord être signalée – donc déjà détectée – pour que l'algorithme HealthMap la détecte." La scientifique continue son analyse en démontrant les biais d’une analyse trop rigide des mégadonnées, comme le fit une équipe d’épidémiologistes d’Harvard lors de la même épidémie d’Ebola en Sierra Leone. L’une de leurs erreurs était d’avoir utilisé aveuglément la technique du contact tracing, déjà utilisée pour analyser et prévenir la propagation de la malaria au Kenya.

"Dans la maîtrise des maladies, les corrélations (statistiques) seules sont des points de départ très faibles pour les campagnes d'éducation et d'éradication."
Susan Erikson
professeure des sciences de la santé à l’Université Simon Fraser

... et du contact tracing

Cette technique, développée à la vitesse grand V en Europe pour combattre le coronavirus, permet de suivre les mouvements et les contacts de la population en traquant les signaux émis par les GSM. Dans le cadre de la malaria, les résultats avaient corroboré les observations sur le terrain: les occurrences de la maladie suivaient les lignes de migration.

Pour l’Ebola, observe la scientifique, l’utilisation de cette technique s’est révélée fausse pour deux raisons. D’abord, les Africains de l’Ouest n’ont pas ce sens exclusif de la propriété que nous avons avec notre GSM: ils se le partagent aisément, déconnectant le GSM de leur propriétaire et faussant du même coup les données (sans compter les problèmes de réseaux, récurrents dans ce pays). Ensuite, les utilisateurs de big data ont ignoré l’un des facteurs essentiels de la transmission de la maladie: la tradition ancestrale qui veut que l’on touche le mort lors de la cérémonie funéraire.

"Aux États-Unis, il y a un gros débat sur le nombre de gens tués à cause du confinement. Les modèles que nous avons utilisés n’incluaient pas du tout ces conséquences."
Alex Pentland
cofondateur du MIT Media Lab

C’est donc l’anthropologie et non les mégadonnées, plaide l’auteur, qui a permis de cerner la cause principale de la propagation du virus, et de la maîtriser progressivement. "Dans la maîtrise des maladies, conclut Susan Erikson, les corrélations seules sont des points de départ très faibles pour les campagnes d'éducation et d'éradication. Les corrélations statistiques ne fournissent tout simplement pas suffisamment d'informations utiles pour produire des résultats significatifs; elles doivent être accompagnées d'interventions de santé publique intelligentes."

Les effets collatéraux ignorés

Alex Pentland ne pense pas autre chose. Ce cofondateur du MIT Media Lab à Boston est l’une des 7 voix les plus écoutées au monde dans le domaine du big data, selon le magazine Forbes. "Il est important, si on utilise l’intelligence artificielle, nous explique-t-il d’emblée lors d’une interview par Zoom, de définir avec soin le cadre dans lequel on utilise les mégadonnées, en considérant tous les aspects, pour que les décisions prises ne provoquent pas des effets indésirables et potentiellement désastreux pour la population. Si je vous vends une voiture, tout doit être parfait: si le volant se détache quand vous roulez, vous avez le droit de me poursuivre en justice."

Pour Alex Pentland, la gestion de la crise jusqu’à présent montre bien les conséquences d’une utilisation partielle des data. "Ces modèles empiriques sur lesquels on a projeté les courbes de décès, d’admissions en hôpital, de cas infectés, etc., et qui ont abouti à un confinement généralisé, sont en quelque sorte basés sur de l’intelligence artificielle, mais ils n’incluaient pas les effets collatéraux: les problèmes mentaux, le chômage qui a provoqué toutes sortes de problèmes comme la consommation d’alcool, les reports de soins de santé vitaux, les violences conjugales, etc. Aux États-Unis, il y a un gros débat sur le nombre de gens tués à cause du confinement. Les modèles que nous avons utilisés n’incluaient pas du tout ces conséquences. Et ça a déraillé."

Traquer d'éventuelles résurgences du virus

Pour l’heure, le débat a glissé sur la prochaine phase: comment utiliser l’intelligence artificielle et le big data pour traquer les éventuelles résurgences du virus? Comment aussi éviter un second confinement généralisé si une deuxième vague nous rattrape à l’automne? L’outil mis en avant par la plupart des pays est à nouveau le contact tracing, comme ce fut le cas pour étudier l’évolution de la malaria ou, plus proche de chez nous, pour faciliter l’éradication de la tuberculose.

La démarche fait sens. Contrairement aux habitants de Sierra Leone, nous sommes viscéralement collés à nos smartphones: suivre l’appareil, c’est suivre l’individu. En outre, nous avons appris davantage sur la maladie: elle se transmet notamment par le contact, par voie orale. Ce qui nous a poussés à développer certains réflexes comme cette fameuse distanciation sociale. Or nos smartphones détiennent certains outils précieux pour nous éloigner physiquement l’un de l’autre.

La solution bluetooth

À l’aide d’une app installée sur nos téléphones, la technologie bluetooth peut détecter pour nous les moments où nous avons pris un risque. "On peut enregistrer, par exemple, si un smartphone A et un smartphone B ont été en contact pendant 20 minutes à moins d’un mètre", nous explique Hugues Bersini, directeur du laboratoire d’intelligence artificielle de l’ULB et l’un des experts planchant sur ce type de solution en Belgique. L’avantage de la technologie bluetooth, continue-t-il, est qu’elle garde les données sur les smartphones et limite les questions sensibles concernant la vie privée.

Deux personnes plongées dans la lecture d’un livre de part et d’autre d’un mur mitoyen peuvent être détectées comme à risque, alors qu’aucune contamination n’est possible.

"Pour ceux qui sont à haut risque, c’est-à-dire ayant été en contact proche et prolongé avec un malade, on leur enverrait automatiquement un rendez-vous pour se faire tester dans un centre de tests, ou via une brigade qui vient lui faire un frottis nasal. On optimise la prise de rendez-vous, les résultats sont communiqués, les contacts sont informés, toute la chaîne est détectée. Par après, si on collecte suffisamment de données, en croisant les données de ceux qui ont été contaminés avec les signaux qui ont été envoyés par leur smartphone, on pourra petit à petit affiner le modèle."

Le problème de la technique, avouent Hugues Bersini et Alex Pentland, ce sont les "faux positifs": deux personnes plongées dans la lecture d’un livre de part et d’autre d’un mur mitoyen peuvent être détectées comme à risque, alors qu’aucune contamination n’est possible. "Si je suis à côté de quelqu’un de malade, mais de l’autre côté d’un plexiglas, est-ce que la police va venir pour me forcer à me mettre en quarantaine? s'interroge Alex Pentland. Vous ne pouvez pas juste construire un machin sans le tester, sans en prévoir les conséquences."

Le contact humain incontournable

Nous vient alors à l’esprit ce scepticisme de Susan Erikson: et si le comportement humain venait à bouleverser les données? Quid, en effet, si à force de "faux positifs", les utilisateurs en viennent à abandonner l’application? Quid aussi des personnes âgées, les plus vulnérables à la maladie et les moins équipées en smartphones? Comment réagirait aussi la technologie en cas de foule, lorsqu’on sait désormais, selon une étude récente, que 80% des contaminations ont émergé de ces moments de "clusters"; resterait-elle fiable? Enfin, comment se comporteront les personnes contactées lorsqu’elles apprendront par leur smartphone qu’elles ont peut-être approché de trop près une personne infectée?

Pour répondre à ce dernier problème, la seule solution est un contact humain, estime Hugues Bersini. Et qui d’autre que le médecin de famille peut prendre sur lui de conseiller son patient dans la bonne voie? "Ça ne sert à rien d’identifier les contacts si on ne met pas tout en œuvre pour les dépister." "Les stratégies et politiques de maîtrise des maladies, continue également Susan Erikson dans son plaidoyer sur Ebola, ont les meilleures chances de fonctionner lorsqu'elles incluent un engagement sur le terrain avec des pratiques sociales instantanées".

La confiance, un facteur clé

Car la confiance est primordiale. L’une des limites d’un tracing complet identifiant, outre le contact, la localisation des individus et leurs déplacements (ce que ne permet pas la technologie bluetooth), c’est cette inquiétude vis-à-vis du respect de la vie privée. Cette confiance pourrait pourtant générer des données utiles.

Pour que le contact tracing soit efficace à l’échelle d’un pays, disent les experts, il faut que 60% de la population télécharge l’application.

Au Danemark, une application sur smartphone, COVIDmeter, permet aux citoyens d’introduire leur état de santé, leurs symptômes, les résultats de leurs tests médicaux. L’application est dérivée de FLUmeter, une autre application concernant la grippe, qui a fait largement ses preuves dans le passé. La plateforme utilise une protection similaire à celles des banques en ligne, et les données parviennent sous forme anonymisée au Statens Serum Institut, l’institut de santé du gouvernement. Cette formule a également inspiré la Grande-Bretagne, où ont participé plus d’un million de citoyens.

"Grâce à ces informations sur les symptômes, commente Hugues Bersini, on a découvert que le premier signe avant-coureur de la maladie, c’était la perte de goût et de l’odorat, et non la fièvre." Des informations dont l’utilité dépend fortement de la masse critique d’une population prête à jouer le jeu et, une fois encore, du comportement humain par rapport à la collection des données. Pour que le contact tracing soit efficace à l’échelle d’un pays, disent les experts, il faut que 60% de la population télécharge l’application.

À ce stade, avec son application Rakning C-19 utilisant la technologie de localisation et non de bluetooth, l’Islande est la championne du monde: 40% de ses 364.000 habitants l’ont téléchargée. Et pourtant, ce n’est pas suffisant, estiment les autorités islandaises qui continuent également de privilégier le contact humain.

"Big data is dead, long live big data"

L’intelligence artificielle et son utilisation des mégadonnées ont donc leurs limites, elles nous empêchent d’avancer à la vitesse nécessaire pour enrayer le virus en l’absence de vaccin. D’ici là, nous manquerons toujours de recul sur "les réponses comportementales des personnes touchées, ce qui rend difficile l'adaptation rapide ou l'interprétation de modèles très complexes sur les échelles spatio-temporelles pertinentes pour la prise de décision", résume Caroline Buckee, épidémiologiste à Harvard, dans un article publié en mars dernier dans la revue médicale The Lancet.

Un article au titre qui en dit long sur ce mélange d’espoir et de désarroi des épidémiologistes: "Big data is dead, long live big data". Et la scientifique de poser le vrai danger: "Étant donné que les décideurs politiques n'ont généralement pas d'expertise approfondie en modélisation, un manque de communication claire risque de produire deux résultats négatifs: croire les modèles sans discernement et les décisions seront prises sur base de mauvaises informations, ou rejeter la modélisation d'emblée et ne pas utiliser les preuves dont nous disposons pour contenir les épidémies de manière aussi efficace que possible."

Entre les deux chemins, nous serions comme l’âne indécis de Buridan: n’ayant pu décider lequel il devait prendre, il mourut sur place, à l’intersection.

Lire également

Publicité
Publicité