reportage

La machine observe votre regard

La technologie développée par Ittention ne se base pas sur l’eye-tracking. Elle repose sur un algorithme capable de déterminer en un clic ce qui attire l’œil d’un observateur. ©Ittention

En un clic, les algorithmes sont désormais capables de déterminer instantanément ce qui attire le regard d’un être humain.

Prenez une machine à café, un objet a priori anodin, et posez-vous cette question: pourquoi tel bouton est-il placé à tel endroit plutôt qu’à un autre? La réponse à ce genre de question, bien que simple en apparence, occupe pourtant les designers de produits du monde entier depuis de nombreuses années déjà. Chaque composant de ce type d’appareil, ou d’autres d’ailleurs, fait l’objet d’une attention particulière afin d’être placé de manière réfléchie à un endroit bien précis.

Mais si ce type de réflexion a longtemps été confié à des experts, les techniques en la matière ont été considérablement modernisées tout récemment. En effet, numérique oblige, un changement de taille est venu bousculer les pratiques qui prévalaient jusque-là: l’arrivée des algorithmes. Désormais, derrière les formes et les volumes des appareils de domotique, se cachent de nombreuses études et analyses réalisées intégralement sur ordinateur. En une fraction de seconde, elles permettent de déterminer si une machine à café est bien pensée telle qu’elle est ou si des modifications doivent y être apportées. Et dans ce domaine, la Belgique est la pointe.

Ittention, spin-off de la faculté polytechnique de l’université de Mons (UMons), a été reconnue récemment comme l’une des meilleures au monde par la prestigieuse université de Princeton aux Etats-Unis. Elle travaille sur ce que l’on appelle l’"attention computationnelle", à savoir l’analyse automatisée des processus de l’attention visuelle par un ordinateur. Pour faire simple, en un clic, l’algorithme qu’elle développe permet de savoir ce qui tape dans l’œil d’un utilisateur lorsqu’il est confronté à une image, une vidéo, un site internet, un objet, voire même une situation de la vie de tous les jours... et ce sans analyser directement son regard. La technologie développée par la jeune pousse est conçue de telle manière qu’elle n’a pas besoin d’observer directement l’œil de l’observateur. Elle se base plutôt sur de grands principes comme la rareté d’un élément, les couleurs, les possibles mouvements à l’œuvre d’un objet, les textures ou encore les contrastes locaux qui composent tout visuel qui lui est présenté.

Analyse du site de L'Echo, par Ittention

Des origines médicales à la publicité

Derrière ce projet, se cache un homme: le Dr. Matei Mancas, chercheur à l’UMons depuis 2003 et dont le premier article scientifique sur le sujet date de 2005. Français d’origine, il a été attiré dans la cité du Doudou par un projet du centre de recherche multidisciplinaire Multitel, renonçant de facto à une carrière de consultant à laquelle ses études dans une école d’ingénieur parisienne le prédestinaient pourtant. Quand ledit projet est arrivé à son terme, il a souhaité prolonger l’aventure en effectuant un doctorat, "une manière de se trouver soi-même", confie-t-il à ce sujet. Assez logiquement, l’ingénieur s’est dirigé vers la très proche Faculté polytechnique de Mons.

Des machines et des hommes

Les chercheurs ne cessent d’"augmenter" l’être humain, d’améliorer ses performances, de prévenir ses maladies et, partant de là, de dépasser les limites liées à sa propre nature.

Nous sommes allés à la rencontre des pionniers belges, notre dossier >

Là, en travaillant sur la segmentation d’images médicales(*) dans le cadre de sa thèse, le Dr. Matei Mancas a eu l’idée de transposer les procédés utilisés dans ce domaine aux algorithmes de perception de l’attention. Une transition possible par le fait que les deux techniques sont assez similaires. En effet, elles se focalisent toutes deux sur des morceaux d’images qui sont ensuite comparés à l’ensemble dont elles proviennent.

Pour avancer, "j’ai dû lire plein de choses sur le cerveau, l’œil,... des choses qui étaient a priori réservées au domaine médical ou de la biologie, se souvient le chercheur. C’était véritablement prenant, cela touche à l’humain et donc, c’est transdisciplinaire." Et c’est ce qui fait la particularité de sa solution: il n’y a rien de très compliqué derrière l’algorithme d’Ittention, juste une bonne idée au départ.

Une idée qui lui a permis de se différencier de son proche cousin, à savoir l’"eye-tracking" (soit l’analyse du regard par le biais de caméras). En effet, l’analyse computationnelle "permet de savoir ce que les gens ont vu alors que l’eye-tracking permet de déterminer où les gens ont regardé". Si, en pratique, lorsque l’on compare les deux méthodes, l’on peut observer un recouvrement à 90% des résultats, la question des 10% restants persiste. Et c’est là que l’attention computationnelle se démarque véritablement. Elle permet d’éliminer une certaine forme de subjectivité en s’affranchissant de l’aspect regard. En effet, "ce n’est pas parce que l’on n’a pas regardé une zone de l’image que l’on ne l’a pas vue", lance le Dr. Mancas. Le regard n’est donc pas l’indicateur, selon lui, parce qu’il ne permet d’apprécier que la partie active de la perception visuelle.

Si l’influence de cette technologie sera bien entendu perceptible, dans un premier temps, au niveau des vendeurs, les consommateurs pourraient aussi à terme être concernés de par une possible amélioration de leur qualité de vie à terme. En effet, pour ne citer que cet exemple, quiconque surfe sur internet l’aura déjà remarqué: la publicité y est omniprésente. Or, "on arrive à saturation", d’après le chercheur. Il suggère donc, en s’appuyant sur ses études, qu’"au lieu de placer 25 pubs que les gens font exprès de ne pas regarder, voire bloqueront à l’aide de logiciels, autant essayer de trouver un format plus efficace". L’homme propose par exemple un format d’habillage publicitaire en arrière-plan d’un site web en lieu et place d’une multitude de petites bannières. Ce type de communication serait plus efficace, selon le Dr. Mancas. "Et on peut le prouver." L’environnement publicitaire de l’internaute pourrait donc à terme être modifié dans le bon sens.

"L’eye-tracking permet de déterminer où les gens ont regardé, quand l’analyse computationnelle permet de savoir ce que les gens ont vu."
Matei Mancas
Chercheur à l’UMons

L’enjeu de la commercialisation

Pour parvenir à ce genre de conclusions, le Dr. Matei Mancas a dû investir temps et argent dans le développement de son puissant algorithme. Si le chercheur a rapidement décroché une bourse (soit deux ans de salaire) à l’occasion d’un appel à projet de la Région wallonne, il a aussi dû réfléchir aux pistes de monétisation dès les premières heures du projet. Heureusement pour lui, la technologie développée par Ittention a de nombreuses applications concrètes et génératrices de revenus: du catalogue de supermarché que l’on retrouve dans sa boîte aux lettres à habillage de site internet, en passant par le stand d’une foire ou l’étalage de petit commerce, les clients potentiels ne manquent pas pour la spin-off montoise.

L’attention d’un internaute détermine le placement d’une publicité. ©Ittention

Mais les défis qui se dessinent à l’horizon restent nombreux, ce qui suggère aussi des pistes de croissance potentielle dans le cas où l’entreprise parviendrait à tirer son épingle du jeu en la matière. Il s’agit principalement de la réalité augmentée, à savoir la projection d’objets numériques sur la réalité, et du cinéma 3D. Concernant ce dernier, l’enjeu est en effet de taille, mais simple à comprendre: comment réussir à déterminer le plan qu’un téléspectateur regarde? La question doit encore être étudiée.

En l’état, les perspectives pour Ittention sont bonnes. La jeune pousse table sur chiffre d’affaires tournant autour des 150.000 euros d’ici un an. Une personne a même approché son fondateur en lui demandant s’il pensait pouvoir être capable de multiplier par vingt ses revenus dans les prochaines années. Une réelle demande semble donc se dessiner pour ce type de service.

Pour soutenir la croissance et les développements inhérents à celle-ci, la spin-off va devoir embaucher car, en l’état, la start-up compte trois employés au profil "plus technique". Il lui manque dès lors un profil plus commercial parce que "la manière de faire est différente" de celle d’un chercheur, sourit Matei Mancas avant de glisser que selon lui "on est vendeur ou on ne l’est pas". Or, "c’est clairement un truc qui manque chez les chercheurs". Ils pensent trop souvent à l’aspect technologique pur, sans réfléchir à la commercialisation de leur solution. Toutefois, les choses seraient en train de changer petit à petit, grâce aux différentes synergies permises par les incubateurs et les échanges interfacultaires. Un bon point selon le Dr. Mancas.

(*) processus automatisé d’identification sur une image de régions potentiellement intéressantes pour un traitement ou un diagnostic médical.

Le danger

Une machine qui en sait trop

Jusqu’à présent, les nombreuses méthodes utilisées en vidéosurveillance restent assez spécifiques, permettant par exemple de déterminer si une personne a oublié sa valise ou la direction qu’elle suit. Mais, là où il conviendrait de placer un garde-fou selon le Dr. Mancas, ce serait lorsque ces méthodes deviennent plus globales, boostées par le deep learning. Parce que grâce à cette technologie, la machine pourrait décider d’entamer proactivement une analyse plus globale, avec le risque de "détecter des choses qui ne doivent pas forcément l’être". Le simple fait qu’une personne agisse de manière différente par rapport aux autres pourrait faire qu’elle soit signalée. Ce qui n’est pas sans poser question au niveau de la vie privée, surtout quand on sait qu’il peut arriver que ces machines "prennent des décisions que l’on ne peut pas forcément expliquer""On peut les expliquer en gros, mais pas de manière détaillée", détaille le Dr. Mancas.


Lire également

Contenu sponsorisé

Partner content