Le "big data" est en grande partie une "big bubble" (Geert Noels)

Comme le pétrole, les données doivent être " raffinées " pour avoir une réelle valeur pour l’économie. Mais hélas, bon nombre d’entre elles sont inutilisables dans les nouveaux moteurs hautement technologiques.

"Les données sont le nouveau pétrole", titrait The Economist en 2017. L’or noir était la matière première principale et le "driver" de l’ancienne économie, mais il a dû céder sa place aux "data" dans la nouvelle économie.

Geert Noels

Économiste et fondateur d'Econopolis

On peut encore pousser plus loin cette comparaison: comme le pétrole, les données doivent être "raffinées" pour avoir une réelle valeur pour l’économie. Mais hélas, bon nombre d’entre elles sont inutilisables dans les nouveaux moteurs hautement technologiques.

Certains attribuent l’invention de l’ordinateur à Charles Babbage, un savant anglais du XIXe siècle. On lui aurait un jour posé la question suivante: "M. Babbage, si vous encodez de mauvais chiffres dans la machine, donne-t-elle des réponses correctes?"

La loi du "GIGO"

Bien entendu non, car on savait déjà à l’époque que "l’intelligence" des machines dépendait des informations encodées. Le principe "GIGO" était né: "Garbage In, Garbage Out". Les logiciels et systèmes d’exploitation dépendront toujours de la qualité des informations qui leur sont fournies.

Ce terme n’est apparu que lorsque les ordinateurs ont fait leur percée, c’est-à-dire beaucoup plus tard, avec l’arrivée de l’ordinateur central ("mainframe computer"). Un certain George Fuechsel, un programmeur d’IBM, aurait utilisé le terme "GIGO" pendant un cours donné à des clients à New York sur l’ordinateur 305 RAMAC.

Soixante ans plus tard, la technologie a évolué. Les processeurs sont aujourd’hui infiniment plus rapides qu’à l’époque de Babbage et de Fuechsel, et des possibilités quasi infinies sont apparues.

Les algorithmes ont pris de plus en plus d’importance aux côtés des données. C’est pourquoi on pense aujourd’hui que les ordinateurs sont devenus très intelligents.

Les machines pourraient même apprendre par elles-mêmes, en d’autres termes, devenir plus intelligentes en évaluant elles-mêmes leurs propres résultats et en améliorant en permanence les processus de traitement des informations.

©Ahn Young-Joon_ISOPIX

Les ordinateurs les plus intelligents battent les humains dans les jeux les plus difficiles: jeu d’échec, de Go, et même le très difficile quizz "Jeopardy". De quelles autres preuves avons-nous besoin? La loi du "GIGO "est-elle aujourd’hui dépassée? Les ordinateurs sont-ils aujourd’hui capables de donner de bonnes réponses à partir de données erronées?

Hélas, les algorithmes ne savent pas si les données qui leur sont fournies sont correctes, de qualité, ou du "junk". Par ailleurs, il peut arriver que des erreurs se glissent dans les algorithmes. Tous les utilisateurs de "spreadsheets" connaissent ce danger. Un fichier Excel ne dépend que de la qualité des données chiffrées et des formules introduites dans la feuille de calcul.

Rien n’est plus dangereux qu’une feuille de calcul contenant des formules inexactes, des liens incorrects et des erreurs dans les données de base. En une milliseconde, la feuille de calcul fournit une réponse jusqu’à 9 chiffres après la virgule, ce qui donne une fausse apparence de précision.

Il est difficile d’imaginer l’ampleur des dégâts causés par Excel dans le monde des entreprises suite à des décisions importantes prises sur base de feuilles de calcul complexes et en apparence géniales, certes, mais complètement erronées. Et combien de fois les consultants ou le CFO reconnaissent-ils leurs erreurs?

Les feuilles de calcul sont accessibles à beaucoup de monde, et on découvre de temps en temps des erreurs. Dans l’univers actuel des "big data", du "self-learning" et des "smart systems", cela devient de plus en plus difficile. Plus les choses ont l’air compliquées, plus on a tendance à leur faire confiance.

Dans le film WarGames de John Badham (1983) avec Matthew Broderick dans le rôle principal, une guerre nucléaire a pu être évitée de justesse, parce que le super-ordinateur devenu fou se rend compte juste à temps de ses propres incohérences. Et devinez: récemment, un général d’armée américain a proposé de confier les codes nucléaires à un algorithme.

Foi aveugle

Ne me comprenez pas mal. L’intelligence artificielle, le big data et autres "systèmes intelligents" ouvrent d’énormes perspectives. Mais je déteste cette foi aveugle dans l’infaillibilité de ces systèmes et la manière particulièrement crétine avec laquelle ils sont présentés.

©AFP

Ils offrent en effet aux charlatans d’énormes possibilités de vendre leur beau "garbage" dans un bel emballage en prétendant qu’il s’agit d’un système intelligent et fiable. Le "big data" se résume encore souvent à du "big data junk", où les spécialistes doivent chercher des pièces utilisables au milieu des déchets.

Je vois de nombreux "systèmes intelligents" qui m’ennuient rapidement avec des réponses stupides, leurs liens prévisibles et erronés, et des recommandations certes attrayantes, mais totalement fausses.

Les données ne sont donc pas le nouvel or noir. Elles sont, comme le pétrole, une matière première qui doit être raffinée.

Les données ne sont donc pas le nouvel or noir. Elles sont, comme le pétrole, une matière première qui doit être raffinée. Mais contrairement au pétrole, de nombreuses données ne peuvent absolument pas servir de lubrifiant pour la prise de bonnes décisions, et créent un smog qui aveugle.

Les entreprises qui pensent qu’elles sont assises sur une mine d’or grâce à leurs caves remplies de données historiques, et qu’elles doivent attirer des chercheurs d’or – excusez-moi, des spécialistes en données – pour les faire émerger, devraient plutôt se préparer à découvrir du toc.

Pour une large part, le "big data" devrait se révéler être une "big bubble". Tout comme la feuille de calcul ne rend pas vos finances plus saines, les données issues d’un mauvais modèle opérationnel ne peuvent le transformer en modèle performant. "Garbage In, Garbage Out" est donc toujours d’application, ou plus encore. "Big Garbage In, Gigantic Garbage Out". L’intelligence artificielle et le "big data" sont l’avenir, certes, mais elles ne pourront jamais remplacer la créativité et l’esprit critique du cerveau humain.

Lire également

Publicité
Publicité

Echo Connect

Messages sponsorisés

n