Voorbij het LLM-tijdperk: David Silver’s zoektocht naar echte superintelligentie

10

David Silver, de geest achter het baanbrekende AlphaGo, is van mening dat het huidige traject van kunstmatige intelligentie fundamenteel gebrekkig is. Terwijl de technische wereld momenteel geobsedeerd is door Large Language Models (LLM’s), stelt Silver dat het vertrouwen op door mensen gegenereerde gegevens een doodlopende weg is voor het bereiken van echte superintelligentie.

Via zijn nieuwe onderneming, Ineffable Intelligence, probeert Silver de industrie weg te leiden van ‘nabootsing’ en naar een model van autonoom, zelfvoorzienend leren.

Het “fossiele brandstof”-probleem van LLM’s

De huidige hausse aan AI wordt grotendeels aangedreven door LLM’s: systemen die zijn getraind op enorme datasets van menselijke tekst, code en boeken. Silver beschouwt deze methode als inherent beperkt. Hij beschrijft menselijke data als een “soort fossiele brandstof”**: een ongelooflijke sluiproute die een eerste impuls geeft, maar uiteindelijk eindig en niet-hernieuwbaar is.

Het kernprobleem is dat LLM’s leren van wat mensen al hebben gedaan. Het zijn eerder reflecties van de menselijke intelligentie dan onafhankelijke ontdekkingsmotoren. Silver stelt dat als een AI zich beperkt tot menselijke gegevens, deze nooit de collectieve kennis van zijn makers kan overtreffen.

“Je kunt systemen zien die voor zichzelf leren als een hernieuwbare brandstof – iets dat gewoon kan leren en leren en voor altijd kan leren, zonder beperking”, legt Silver uit.

Om dit te illustreren gebruikt Silver een gedachte-experiment: als je een krachtige LLM zou uitbrengen in een wereld waarin iedereen geloofde dat de aarde plat was, zou de AI een deskundige ‘platte aarde’ worden. Zonder het vermogen om met de werkelijkheid te communiceren of zijn eigen experimenten uit te voeren, blijft het gevangen zitten in de vooroordelen en beperkingen van zijn trainingsgegevens.

Het pad naar superintelligentie: versterkend leren

In plaats van AI meer tekst te geven, verdubbelt Silver de inzet van reinforcement learning (RL). Dit is het proces waarbij een AI met vallen en opstaan ​​leert, in interactie met een omgeving om specifieke doelen te bereiken. Dit was het mechanisme dat AlphaGo in staat stelde het spel Go onder de knie te krijgen – niet door boeken over strategie te lezen, maar door miljoenen spellen tegen zichzelf te spelen.

Silver’s visie voor Ineffable Intelligence is om dit concept te verplaatsen van de ‘beperkte werelden’ van games als Go naar de immense complexiteit van de echte wereld. Zijn strategie omvat:

  • Gesimuleerde omgevingen: Het plaatsen van AI-agenten in zeer geavanceerde simulaties waar ze kunnen communiceren, samenwerken en hypothesen kunnen testen.
  • Autonome ontdekking: Het creëren van ‘superleerlingen’ die niet alleen informatie verwerken, maar actief nieuwe wetenschappelijke, economische of technologische principes ontdekken.
  • Intelligentie opschalen: Systemen bouwen die hun intelligentie kunnen schalen zonder gebonden te zijn aan ‘menselijke priors’ (de vooropgezette ideeën en vooroordelen die inherent zijn aan menselijke gegevens).

Veiligheid en de uitlijningsuitdaging

Een belangrijke zorg in de race om superintelligentie is AI-uitlijning : ervoor zorgen dat een machine die slimmer is dan mensen gunstig blijft voor de mensheid.

Critici zijn bezorgd dat een AI die door puur vallen en opstaan ​​leert, ‘optimale’ oplossingen zou kunnen ontdekken die efficiënt maar moreel catastrofaal zijn. Silver en zijn achterban, waaronder Lightspeed Ventures, beweren echter dat zijn aanpak misschien wel veiliger is.

Door deze agenten binnen gecontroleerde simulaties te ontwikkelen, kunnen onderzoekers opkomend gedrag in realtime observeren. Ze kunnen zien hoe een agent met ‘mindere intelligenties’ omgaat of met tegenstrijdige doelen omgaat voordat de technologie ooit in de echte wereld wordt ingezet. Dit maakt een proactieve benadering van veiligheid mogelijk, in plaats van een reactieve.

Een missie met een hoge inzet

De omvang van Silver’s ambitie wordt weerspiegeld in de financiële steun van Ineffable Intelligence. De startup heeft al $1,1 miljard aan startfinanciering veiliggesteld en bereikt een waardering van $5,1 miljard. Dit is een buitengewoon cijfer voor een in Europa gevestigd AI-bedrijf en onderstreept het geloof van de industrie in de ‘zuiverheid van visie’ van Silver.

Ondanks de enorme rijkdom die op het spel staat, handhaaft Silver een filantropische houding. Hij heeft zich ertoe verbonden alle opbrengsten van Ineffable Intelligence te doneren aan liefdadigheidsinstellingen met een grote impact, waarbij hij het streven naar superintelligentie beschouwt als een diepgaande verantwoordelijkheid voor de toekomst van de mensheid.


Conclusie: Hoewel het huidige AI-landschap wordt gedomineerd door modellen die menselijke kennis nabootsen, gokt David Silver erop dat de volgende sprong in intelligentie zal komen van machines die volledig zelfstandig leren navigeren en de wereld begrijpen.