La machine à créativité, interview de Stephen Thaler
Inventeur d’une nouvelle méthode d’utilisation des réseaux neuronaux, Stephen Thaler a déposé pas moins de vingt brevets autour de sa machine de créativité, dont il prétend qu’elle pourrait permettre à des robots d’apprendre, et d’évoluer par eux-mêmes...
Qu’est-ce qui distingue la machine de créativité d’autres expériences visant à amener une machine à une action intelligente ?
À mon sens, jusqu’à présent, il n’y a jamais eu de comportement intelligent dans les robots. Ils se sont comportés comme des "poupées high tech" impliquant soit un contrôle par des opérateurs humains, soit l’écriture d’algorithmes complexes à base de règles issues de l’esprit humain. En résultat, le comportement des robots, s’il peut paraître impressionnant, n’est que le fruit de "script" qui parodient l’intelligence animale.
Pour en sortir, il faut que les réseaux neuronaux fassent quelque chose que les réseaux traditionnels ne peuvent faire. Ces derniers ne peuvent générer aisément des idées et des stratégies se trouvant en dehors de l’expérience. Si des organismes sont simplement pré-programmés pour réagir d’une certaine façon à certain scénarios, ils s’avèrent inflexibles et ont du mal à s’adapter à des conditions environnementales changeantes. Les organismes qui réussisent doivent manifester de la créativité, inventer de nouveaux concepts et plans d’action afin de répondre aux changements de l’environnement.
La "machine de créativité" permet à des réseaux neuronaux artificiels de se montrer créatifs : ils peuvent engendrer de nouveaux modèles de comportements qui s’écartent des actions habituelles. C’est ce principe directeur qui va permettre aux robots d’inventer de nouvelles actions (par exemple, tomber dans un trou boueux et inventer une nouvelle séquence d’actions pour s’en sortir)...
Qu’est-ce qui vous a permis d’en découvrir les principes ?
Mes expériences remontent au début des années 1970, alors que j’effectuais quelques expériences à partir des premiers réseaux neuronaux artificiels. Au cours des années 1980, j’ai réalisé qu’en introduisant le niveau adéquat de dégradation dans le réseau, il en résultait quelque chose de comparable à des idées sensées, dérivées de l’espace conceptuel sur lequel ils avaient été entraînés. J’ai par la suite découvert quels étaient les régimes optimaux de perturbation de tels réseaux neuronaux qui optimiseraient la production d’idées potentiellement bonnes. Je les ai suffisamment maîtrisés pour qu’il soit possible de produire de nouvelles découvertes conceptuelles telles que des produits d’hygiène personnelle commercialisables, de la musique originale, des composés chimiques, des découvertes linguistiques... C’est à peu près à ce moment que j’ai commencé à introduire toute une gamme d’effets de feedback, analogue à des "facteurs de frustration". À défaut de percevoir l’émergence d’un modèle intéressant, la machine commande un accroissement du nombre ou de l’amplitude des perturbations, afin de maintenir une agitation, jusqu’à ce que l’on arrive à un concept utile. Par la suite, la machine a appris à placer intelligemment de telles perturbations. Et c’est devenu la "machine de créativité".
En bref, la machine de créativité a inventé une méthode qui permet à un réseau neuronal de s’auto-entraîner, sans avoir recours à un algorithme d’entraînement explicite. L’architecture consiste en un réseau neuronal "non entraîné" associé à un autre réseau qui est "l’entraîneur". De cette façon, la machine peut s’auto-expérimenter afin de confirmer si les stratégies inventées ont produit l’effet désiré. Elle peut alors réabsorber cette expérience et atteindre de plus hauts niveaux de compétences. Il est donc possible de construire des processeurs de robots capables de partir d’une absence d’expérience vers des niveaux de maîtrise de plus en plus élevés.
Vous affirmez que la machine de créativité serait la solution idéale pour créer des robots à auto-apprentissage. Pouvez-vous en donner des exemples concrets ?
Les robots doivent rapidement expérimenter des stratégies alternatives puis apprendre à sélectionner les comportements infructueux, tout en renforçant ceux qui s’avèrent fructueux. Par conséquent des robots à auto-apprentissage doivent être capables de cycles répétitifs de création de comportement puis d’apprentissage des modèles à succès, si possible, sans que des humains les ralentissent ou biaisent de tels choix. Or, au niveau de la phase de génération de stratégies, je ne peux imaginer une méthode plus rapide que la machine de créativité. Prenons un bras robotisé à six axes. Si un réseau neuronal observe la gamme de mouvements d’un tel bras, il sait automatiquement où se trouve la pince. Il écrit une équation de mouvement implicite du bras en tenant compte des poids de connexion, sans avoir à se reposer sur un professeur de physique. Pour que la pince se pose sur une cible particulière jamais vue auparavant, il est possible d’introduire des perturbations synaptiques internes pour produire de nouveaux signaux, adaptés de ceux qu’il a expérimentés auparavant. Par la suite, la machine de créativité s’auto-organise pour optimiser son taux d’apprentissage en situation.
Vous dites aussi que la machine de créativité a été distinguée par des officiels de haut de niveau de la NASA comme le meilleur pari en matière d’IA. Qui sont ces officiels de la NASA ?
Le plus grand avocat de cette technologie a été le Dr Dennis Bushell, ingénieur en chef (chief scientist) de la NASA à Langley qui a inclus la machine de créativité dans un grand nombre des présentations qu’il a données dans le monde. Nous sommes toutefois entrés en désaccord concernant leur rôle dans le futur de l’IA. Un autre supporter à la NASA est Ahmad Noor, qui entrevoit l’immense potentiel des machines de créativité dans l’exploration spaciale avec des véhicules qui peuvent s’auto-adapter à la détérioration durant leurs missions.
Propos recueillis par Daniel Ichbiah