Quand des machines apprennent à d'autres machines à apprendre
Google s'est lancé dans un projet de recherche assez fou, avec des premiers résultats prometteurs.
Par Étienne Combier
C'est un nouveau pas vers une intelligence artificielle encore plus développée qu'actuellement. Alors que l'apprentissage automatisé par les machines, ou machine learning, est un des secteurs les plus en vogue dans la Silicon Valley, Google veut aller plus loin. comme le pointe Wired, la firme de Mountain View travaille sur un projet de création de machines qui formeraient elles-mêmes d'autres machines à l'apprentissage automatisé.
Ce projet ressemble en fait à celui d'une école normale de professeurs. Cette école, qui forme les professeurs à former, est l'une des briques majeures de notre système scolaire. En résumant, Google cherche à faire la même chose, mais avec le machine learning.
Les machines meilleures formatrices que les humains
Cette technologie est en plein développement aujourd'hui. Grâce à un réseau neuronal numérique, qui imite les neurones humains, les machines «apprennent» à reconnaître un objet d'un autre, à gérer les recommandations sur Spotify ou bien à proposer des produits complémentaires après un achat sur Internet par exemple. Avec une quantité de données de plus en plus importante à gérer, les géants du Web ont rapidement vu l'importance du machine learning pour coller le plus possible aux attentes de leurs utilisateurs.
Lire aussi :
> Le « machine learning » au service des médias > 2013 : les GAFA se ruent sur le « machine learning » > Blue River Technology, la start-up de machine learning qui a séduit John Deere
Dénommé « AutoML » (pour Machine Learning), le projet de Google a donc pour but d'apprendre à une machine à apprendre à d'autres machines, plus précisément des logiciels. La mise en abîme est certes vertigineuse, mais cela permettrait de rendre le processus d'apprentissage plus efficace.
De fait, comme le pointe Wired, les machines formées par d'autres machines ont catégorisé des images avec une précision de 82 %. Pour localiser les objets dans une image, une tâche très difficile, AutoML a réussi à 43 % contre 39 % pour les logiciels conçus par les humains.
Un savoir que Google veut diffuser
Les machines seraient donc de meilleures «formatrices» que les humains. Cette performance est importante, à l'heure où les spécialistes du machine learning ne sont que quelques milliers dans le monde. Elle est également intéressante car les chercheurs en machine learning ne savent toujours pas précisément comment les machines apprennent. Une automatisation permettrait de vérifier une nouvelle théorie énoncée qui estime que l'apprentissage se fait en oubliant les choses non essentielles.
Automatiser ce savoir, qui nécessite souvent de longues heures à des humains, permettrait également de le diffuser plus largement à d'autres secteurs. «Nous voulons permettre à des centaines de milliers de développeurs d'utiliser ce type de logiciel», a ainsi affirmé Sundar Pichai, le PDG de Google le 4 octobre dernier. Aucun chercheur travaillant sur le projet n'a cependant pu en parler à Wired.
Le risque du biais
Cependant, ces machines formant d'autres machines ne sont pas sans danger. Comme le relève le magazine, les machines «apprenantes», par des humains ou d'autres machines, sont dépendantes des valeurs que les humains injectent. Les biais sociétaux ou sexistes ont ainsi pu apparaître chez certains logiciels, l'un des plus célèbres étant Tay, le bot Twitter de Microsoft, désactivé après ses propos racistes en 2016.
Pour Mehryar Mohri, professeur à la New York University, interrogé par Wired, l'automatisation du processus d'apprentissage va permettre précisément de se concentrer sur ces biais.
En attendant, Google souhaite diffuser au maximum cette technologie, même au-delà de l'entreprise. «Nous voulons démocratiser tout ça», a ainsi affirmé Sundar Pichai. Si AutoML réussit à tenir ses promesses, les machines apprenantes pourraient être beaucoup plus nombreuses à l'avenir.
Etienne Combier