carte blanche

L'interaction vocale, le nouveau graal des géants d'Internet

École polytechnique de l'ULB

La dernière expérience de Facebook en intelligence artificielle a confirmé ce potentiel au point d’avoir nourri (à tort) le fantasme des machines et de l’IA qui prennent le pouvoir.

Par Charles Cuvelliez
Ecole polytechnique de Bruxelles, ULB

L’accord entre Google Express et Walmart pour contrer Amazon dans le e-shopping vocal, la bataille entre enceintes connectées des géants du net et leurs assistants vocaux ne sont que les faces d’un nouvel enjeu, aussi révolutionnaire que les smartphones : une nouvelle manière d’accéder à un web " augmenté ", sans clavier, sans écran, formés d’objets connectés via des commandes vocales. Google joue même sur deux tableaux avec Google Home, son enceinte connectée mais aussi Google Assistant, le logiciel, dans l’espoir de répéter la success story d’Android qui équipe tous les smartphones.

La dernière expérience de Facebook en intelligence artificielle a confirmé ce potentiel au point d’avoir nourri (à tort) le fantasme des machines et de l’IA qui prennent le pouvoir. Facebook aurait tout stoppé par peur de ce qu’il avait créé : des (chat)bots, ceux-là même qui équipent nos smarpthones, se seraient mis à parler une nouvelle langue inventée de toute pièce.

Cette expérimentation visait à confronter plusieurs bots qui doivent négocier le partage de 2 livres, 1 chapeau et 3 balles. Chaque bot s’est vu attribuer une valeur en points différente pour chaque objet (sinon ils voudraient la même chose) mais, comme toute négociation, aucun ne sait quelle valeur les autres attribuent à quel objet. La récompense, au terme d’une négociation réussie, est le nombre de points récoltés. Les bots sont pénalisés s’ils n’arrivent pas à un accord (avec un score de zéro). Les bots ne peuvent que parvenir à s’entendre, contrairement aux humains.

Négocier, ce n’est pas un jeu

Négocier allie la complexité d’un raisonnement et sa verbalisation: que faire au coup suivant et comment le dire ensuite à son adversaire durant la négociation. Les chercheurs ont permis au bot de simuler, à tout instant, le restant d’une négociation et d’en estimer le score. Ainsi, ce dernier choisira toujours la branche qui aboutira à une récompense maximum. Ces techniques de planification ont été expérimentées avec succès dans les jeux de stratégie ou d’intelligence, les humains ne faisant désormais plus le poids. La nouveauté vient ici de la conversation, du langage qui remplace les règles figées d’un jeu. Les possibilités du langage sont infinies un peu comme si ces règles s’adaptaient en cours de route…

A la grande surprise des chercheurs, les bots ont voulu négocier plus longtemps, prendre leur temps (le secret de bonnes négociations) plutôt que de tourner casaque. Ils ont développé des techniques de leurre, comme donner à penser qu’ils accordent une grande valeur à un objet et d’accepter de le lâcher à contrecœur (alors que la valeur programmée de l’objet est faible). Un tel comportement n’avait pas été ni programmé ni prévu. Enfin, les bots ont produit des nouvelles phrases, éloignées de celles introduites au départ par les chercheurs pour leur donner une base sémantique.

Les chercheurs avaient en effet alimenté les bots avec les dialogues de centaines de négociation menées par des humains dans une même configuration. Les bots se sont ensuite entrainés à négocier contre eux-mêmes pour atteindre leur but, maximiser la récompense, les points collectés. On a donc à faire à un jeu dont les règles sont universelles (le langage humain) pour un but qui n’en dépend pas (ici une négociation sur 2 livres, 1 chapeau, 3 balles). Ce n’est pas comme une application d’IA qui gagne au jeu de go : on ne pourra pas l’utiliser pour gagner aux échecs, ni même simplement y jouer. C’est bien une percée: on peut appliquer cette avancée en IA à d’autres contextes qu’une négociation, pourvu que le langage " humain " en soit le vecteur.

Le modèle a d’ailleurs été testé contre des humains qui ne se sont rendus compte de rien mais au  départ, c’est vrai, les chercheurs n’ont pas imposé aux bots de rester compréhensible. Ils ont développé leur propre langage, ce qui n’a rien de mystérieux. Et c’est là que tout Internet s’est mis à fantasmer….au point que les chercheurs ont dû recourir aux sites de fact-checking pour rétablir la vérité (amusant quand on sait que Facebook se voit reprocher de ne pas assez filtrer les fake news). Au terme d’une négociation réussie avec récompense élevée, le bot propage ce résultat à tous les mots qu’il a utilisés. Progressivement, on le voit privilégier les séquences qui ont donné les meilleurs résultats et qu,i au fil de son auto-apprentissage, devient incompréhensible. Or, le bénéfice des bots est de pouvoir interagir avec des humains, d’où un simple reparamétrage de l’expérience. A l’apprentissage par renforcement (le chatbot s’exerçant contre lui-même), Facebook a imposé un apprentissage supervisé : le forcer à garder un langage humain. Imaginer que l’IA est efficace car il prend les schémas du cerveau humain est simpliste (ici négocier avec du langage humain sans qu’on l’y force). En tout cas, le 30 août dernier, Microsoft et Amazon ont décidé de faire communiquer entre eux leur assistants vocaux : Cortana et Alexa.

Si nous ne développons pas une langue propre à la négociation, c’est qu’au regard de l’évolution, un langage universel est plus efficace, sauf exception comme les maths. Ce qui pose question ici, c’est la capacité d’un bot à parler notre langue dans une tâche sociale complexe. Dans le film her, le héros tombait amoureux d’un système d’exploitation dopé à l’intelligence artificielle qui simulait une compagnie féminine.  ,

Avant d’en arriver là, notre vie de tous les jours est remplie de négociations de toute sorte avec nos semblables: quelle émission regarder, le menu qui plaira à tous, un entretien commercial, la conclusion d’un contrat…Le potentiel de l’IA comme auxiliaire de notre quotidien est bel et bien là !

 

Pour en savoir plus : 
Deal or No Deal? End-to-End Learning for Negotiation Dialogues par Mike Lewis, Denis Yarats, Yann N. Dauphin, Devi Parikh, Dhruv Batra,  Facebook AI Research et Georgia Institute of Technology, 16 juin 2017.

Lire également

Messages sponsorisés