Au-delà de l’ère LLM : la quête de David Silver pour une véritable superintelligence

6

David Silver, l’esprit derrière le projet révolutionnaire AlphaGo, estime que la trajectoire actuelle de l’intelligence artificielle est fondamentalement erronée. Alors que le monde de la technologie est actuellement obsédé par les grands modèles linguistiques (LLM), Silver affirme que s’appuyer sur des données générées par l’homme est une impasse pour parvenir à une véritable superintelligence.

Grâce à sa nouvelle entreprise, Ineffable Intelligence, Silver tente de faire évoluer l’industrie du « mimétisme » vers un modèle d’apprentissage autonome et auto-entretenu.

Le problème des « combustibles fossiles » des LLM

Le boom actuel de l’IA est en grande partie tiré par les LLM, des systèmes formés sur des ensembles de données massifs de textes, de codes et de livres humains. Silver considère cette méthode comme intrinsèquement limitée. Il décrit les données humaines comme une « sorte de combustible fossile » : un raccourci incroyable qui donne un premier coup de pouce mais qui est finalement limité et non renouvelable.

Le problème central est que les LLM apprennent de ce que les humains ont déjà fait. Ce sont des reflets de l’intelligence humaine plutôt que des moteurs de découverte indépendants. Silver postule que si une IA se limite aux données humaines, elle ne pourra jamais surpasser les connaissances collectives de ses créateurs.

“Vous pouvez imaginer des systèmes qui apprennent par eux-mêmes comme un carburant renouvelable, quelque chose qui peut simplement apprendre et apprendre et apprendre pour toujours, sans limite”, explique Silver.

Pour illustrer cela, Silver utilise une expérience de pensée : si vous publiiez un LLM puissant dans un monde où tout le monde croyait que la Terre était plate, l’IA deviendrait une experte en « Terre plate ». Sans la capacité d’interagir avec la réalité ou de mener ses propres expériences, il reste prisonnier des préjugés et des limites de ses données d’entraînement.

Le chemin vers la superintelligence : l’apprentissage par renforcement

Au lieu de fournir davantage de texte à l’IA, Silver redouble d’efforts sur l’apprentissage par renforcement (RL). Il s’agit du processus par lequel une IA apprend par essais et erreurs, en interagissant avec un environnement pour atteindre des objectifs spécifiques. C’est le mécanisme qui a permis à AlphaGo de maîtriser le jeu de Go, non pas en lisant des livres de stratégie, mais en jouant des millions de parties contre lui-même.

La vision de Silver pour Ineffable Intelligence est de déplacer ce concept des « mondes confinés » de jeux comme Go vers l’immense complexité du monde réel. Sa stratégie implique :

  • Environnements simulés : Placer les agents d’IA dans des simulations hautement sophistiquées où ils peuvent interagir, collaborer et tester des hypothèses.
  • Découverte autonome : Créer des « superapprenants » qui ne se contentent pas de traiter les informations, mais découvrent activement de nouveaux principes scientifiques, économiques ou technologiques.
  • Mise à l’échelle de l’intelligence : Construire des systèmes capables de faire évoluer leur intelligence sans être liés aux « priorités humaines » (les notions préconçues et les préjugés inhérents aux données humaines).

La sécurité et le défi de l’alignement

Une préoccupation majeure dans la course à la superintelligence est l’alignement de l’IA : garantir qu’une machine plus intelligente que les humains reste bénéfique à l’humanité.

Les critiques craignent qu’une IA apprenant par essais et erreurs purs puisse découvrir des solutions « optimales » efficaces mais moralement catastrophiques. Cependant, Silver et ses bailleurs de fonds, dont Lightspeed Ventures, affirment que son approche pourrait en réalité être plus sûre.

En développant ces agents dans le cadre de simulations contrôlées, les chercheurs peuvent observer les comportements émergents en temps réel. Ils peuvent voir comment un agent traite les « intelligences inférieures » ou gère des objectifs contradictoires avant même que la technologie ne soit déployée dans le monde réel. Cela permet une approche proactive de la sécurité plutôt qu’une approche réactive.

Une mission à forts enjeux

L’ampleur de l’ambition de Silver se reflète dans le soutien financier d’Ineffable Intelligence. La startup a déjà obtenu 1,1 milliard de dollars de financement de démarrage, atteignant une valorisation de 5,1 milliards de dollars. Il s’agit d’un chiffre extraordinaire pour une société d’IA basée en Europe et souligne la confiance du secteur dans la « pureté de la vision » de Silver.

Malgré l’énorme richesse en jeu, Silver maintient une position philanthropique. Il s’est engagé à reverser tous les bénéfices d’Ineffable Intelligence à des œuvres caritatives à fort impact, considérant la recherche de la superintelligence comme une profonde responsabilité pour l’avenir de l’humanité.


Conclusion : Alors que le paysage actuel de l’IA est dominé par des modèles qui reproduisent les connaissances humaines, David Silver parie que le prochain bond en avant en matière d’intelligence viendra de machines qui apprendront à naviguer et à comprendre le monde de manière entièrement autonome.