Kunstmatige intelligentie

AI ontmoet efficiëntie: een nieuwe chip verkleint het energieverbruik van LLM’s met 50%

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.
A glowing futuristic AI chip

De voortdurende kunstmatige intelligentie (AI)-golf leidt tot een toename van datacenters, wat een enorme vraag naar stroom veroorzaakt om de servers erin te laten draaien en te koelen.

Hoewel er wereldwijd meer dan 8.000 datacenters zijn, waarvan de meeste in de VS, zal dit aantal de komende jaren aanzienlijk toenemen. 

Volgens de schatting van Boston Consulting Group zal de vraag naar datacenters elk jaar tot 2030 met 15% tot 20% stijgen. Op dat moment verwacht het bedrijf dat ze 16% van het totale Amerikaanse stroomverbruik zullen uitmaken, tegenover slechts 2,5% vóór de release van OpenAI’s ChatGPT in 2022.

Ondertussen verwacht het speciale Energie- en AI-rapport van het Internationaal Energieagentschap (IEA) dat dit jaar is uitgebracht, dat de vraag naar elektriciteit van datacenters wereldwijd tegen het einde van dit decennium minstens zal verdubbelen tot ongeveer 945 TWh. Dit is bijna gelijk aan het huidige verbruik van Japan. 

De in Parijs gevestigde autonome intergouvernementele organisatie meldt dat AI de grootste drijfveer achter deze piek is, waarbij de elektriciteitsvraag van AI-geoptimaliseerde datacenters naar verwachting tegen 2030 meer dan verviervoudigt.

Specifiek in de VS zal het stroomverbruik van datacenters al ongeveer de helft van de groei in elektriciteitsvraag tussen nu en 2030 uitmaken. Aangedreven door AI-gebruik zal de Amerikaanse economie, volgens het rapport, op dat moment meer elektriciteit verbruiken voor het verwerken van data dan voor de productie van alle energie-intensieve goederen samen.

Deze onverzadigbare honger naar energie vormt een enorm probleem voor de vooruitgang en adoptie van AI. Gelukkig is er een lichtpuntje: een groeiend aantal onderzoekers en bedrijven werkt aan het verminderen van het energieverbruik van AI en maakt het energiezuiniger.

Wat interessant is aan deze inspanningen, is dat velen AI gebruiken om hun eigen energie-uitdagingen aan te pakken.

Alleen deze maand heeft een team onderzoekers een nieuwe chip gedemonstreerd die AI gebruikt om de energievoetafdruk van grote taalmodellen (LLM’s) met 50% te verkleinen, wat een belangrijke ontwikkeling is om LLM’s kosteneffectief en duurzamer te laten draaien.

Nieuwe chip benut AI om het energieverbruik van LLM’s te verminderen

Nieuwe chip benut AI

Onderzoekers van de College of Engineering van Oregon State University hebben de nieuwe efficiënte AI-chip ontwikkeld om het enorme elektriciteitsverbruik van LLM AI-toepassingen zoals OpenAI’s GPT-4 en Google’s Gemini op te lossen.

A type of machine learning (ML) model, a large language model (LLM) is pre-trained on vast amounts of data to perform natural language processing (NLP) tasks like text generation, summarization, simplification, text reasoning, language translation, and more.

De meest populaire en breed gebruikte chatbots van vandaag omvatten OpenAI’s GPT-4o, o3 en o1, Gemini en Gemma van Google, Llama van Meta, R1 en V3 van DeepSeek, Claude van Anthropic, Nova van Amazon, Phi van Microsoft en Grok van xAI.

In de afgelopen jaren hebben LLM’s het AI-veld volledig getransformeerd door machines in staat te stellen mensachtige tekst met grotere nauwkeurigheid te begrijpen en te genereren. Deze evolutie van LLM’s heeft echter geleid tot een exponentiële toename van hun omvang.  

De grootte van een LLM, gemeten in het aantal parameters, is de belangrijkste factor voor het energieverbruik. Dit betekent dat hoe groter het model, hoe meer rekenkracht het nodig heeft voor training en inferentie. 

Zo had ChatGPT-1 net onder 120 miljoen parameters, wat steeg naar 175 miljard parameters met GPT-3, en vervolgens naar ongeveer 1,8 biljoen parameters met GPT-4.

Deze enorme toename in grootte en capaciteit van LLM’s betekent dat hun energieverbruik ook op een ongekende schaal stijgt. Naast de grootte van het model beïnvloeden factoren zoals het type hardware dat wordt gebruikt om deze LLM’s te trainen, de duur van het trainingsproces, de infrastructuur, d.w.z. datacenters, gegevensverwerking, modeloptimalisatie en algoritme‑efficiëntie het energieverbruik van LLM’s.

Daarom de nieuwe chip van de OSU-onderzoekers. Volgens Tejasvi Anand, universitair hoofddocent elektrotechniek aan OSU die ook het Mixed Signal Circuits and Systems Lab aan de universiteit leidt:

“Het probleem is dat de energie die nodig is om een enkel bit te verzenden niet even snel wordt verminderd als de vraag naar datarates toeneemt. Dat is wat datacenters zo veel stroom laat gebruiken.”

Om dit probleem te overwinnen, heeft het team een nieuwe chip ontworpen en ontwikkeld die slechts de helft van de energie verbruikt vergeleken met conventionele ontwerpen.

Anand en promovendus Ramin Javad presenteerden deze nieuwe technologie op de IEEE Custom Integrated Circuits (CIC) Conference, die vorige maand in Boston werd gehouden. De conferentie, die forums, panels, tentoonstellingen en mondelinge presentaties organiseert, is gewijd aan de ontwikkeling van IC’s, die dienen als bouwsteen van moderne elektronische systemen door functionaliteit en verwerkingskracht te bieden in een compact en efficiënt pakket.

De nieuwste technologie werd gebouwd met steun van het Center for Ubiquitous Connectivity (CUbiC), de Semiconductor Research Corporation (SRC) en de Defense Advanced Research Projects Agency (DARPA). Het leverde Javadi bovendien de Best Student Paper Award op tijdens de conferentie.

Voor de nieuwe chip maakten de onderzoekers daadwerkelijk gebruik van AI-principes die, volgens Javadi, het elektriciteitsverbruik voor signaalverwerking verminderen.

Zoals hij uitlegt, verzenden en ontvangen LLM’s veel data via draadverbindingen, die kopergebaseerde communicatielinks in datacenters zijn. Dit hele proces vereist aanzienlijke energie, dus een mogelijke “oplossing is het ontwikkelen van efficiëntere draadcommunicatiechips.”

Javadi merkte verder op dat wanneer de data met hoge snelheid wordt verzonden, deze aan het einde van de ontvanger daadwerkelijk wordt beschadigd, en daardoor moet worden opgeschoond. Hiervoor gebruiken de meeste bestaande draadcommunicatiesystemen een equalizer, die veel stroom verbruikt.

“We gebruiken die AI-principes op de chip om de data slimmer en efficiënter te herstellen door de on-chip classifier te trainen om fouten te herkennen en te corrigeren.”

– Javadi

Hoewel dit een grote ontwikkeling is, is dit slechts de eerste versie van de chip. De volgende iteratie is momenteel in ontwikkeling om de energie‑efficiëntie verder te verbeteren.

Over het geheel genomen toont dit lopende onderzoek een groot potentieel met verstrekkende implicaties voor de toekomst van AI-infrastructuur en datacenteroperaties. Maar uiteraard vereist dit een succesvolle implementatie op schaal, wat nooit een gemakkelijke taak is.

Klik hier om te leren hoe AI microchip‑engineering opschudt.

Het temmen van AI’s energie‑honger met doorbraken over alle lagen

Deze nieuwste chipontwikkeling is slechts één van de vele onderzoeksprojecten die het energieverbruik van AI aanpakken. Laten we daarom kort kijken naar de innovatieve manieren waarop onderzoekers dit hebben aangepakt.

Licht gebruiken voor AI‑energie‑efficiëntie 

Eerder dit jaar USST-wetenschappers ontwikkelden1 een microscopische AI-chip, kleiner dan een stofdeeltje of een korrel zout, die licht gebruikt om data van glasvezelkabels te verwerken. Dit belooft snellere berekeningen met minder energieverbruik.

De chip manipuleert licht om direct berekeningen uit te voeren in plaats van lichtsignalen te interpreteren zoals traditionele computers doen. Hiervoor gebruikt hij een “all‑optical diffractive deep neural network”, een technologie die gestructureerde, 3D‑geprinte lagen van componenten stapelt. Hoewel baanbrekend, moeten uitdagingen zoals taak‑specifiek ontwerp, gevoeligheid voor onvolkomenheden en moeilijkheden bij grootschalige productie worden overwonnen om “ongekende functionaliteiten” te bereiken in endoscopische beeldvorming, kwantumcomputing en datacenters.

Enkele maanden daarvoor gebruikten MIT-wetenschappers ook licht om de belangrijkste bewerkingen van een neuraal netwerk op een chip uit te voeren, waardoor ultrasnelle AI‑berekeningen (in een halve nanoseconde) met 92% nauwkeurigheid en enorme energie‑efficiëntie mogelijk werden.

“Dit werk toont aan dat rekenen – in essentie, het in kaart brengen van inputs naar outputs – kan worden gecompileerd op nieuwe architecturen van lineaire en niet‑lineaire fysica die een fundamenteel andere schaalwet van berekening versus benodigde inspanning mogelijk maken.”

– Senior auteur Dirk Englund

De wetenschappers ontwikkelden de fotonische chip2, die bestaat uit onderling verbonden modules die een optisch neuraal netwerk vormen. Opmerkelijk is dat het gebruik van commerciële foundry‑processen voor de fabricage betekent dat hij kan worden opgeschaald en geïntegreerd in elektronica. Daarnaast overwonnen de wetenschappers de uitdaging van niet‑lineariteit in optica door niet‑lineaire optische functie‑eenheden (NOFUs) te ontwerpen die elektronica en optica combineren.

Klik hier om meer te leren over de nieuwe, door het brein geïnspireerde AI die in realtime leert met ultralaag stroomverbruik.

Een softwaretool voor AI‑training & een koelsysteem voor datacenters

Koelsysteem voor datacenters

De onderzoekers van de University of Michigan richtten zich ondertussen op de energieverspilling die ontstaat tijdens AI‑training, meer specifiek wanneer deze ongelijk wordt verdeeld over GPU’s, een noodzaak voor het verwerken van enorme datasets. 

Daarom ontwikkelden ze een softwaretool genaamd Perseus die subtaken identificeert die het langst duren en vervolgens de snelheid van processors die niet op dit ‘kritieke pad’ staan verlaagt, zodat ze hun taken gelijktijdig kunnen voltooien en onnodig stroomverbruik wordt geëlimineerd.

Deze open‑source tool is beschikbaar als onderdeel van Zeus, een tool voor het meten en optimaliseren van AI‑energieverbruik.

Ondertussen wendden onderzoekers van de University of Missouri zich tot het ontwerpen van een next‑gen koelsysteem om datacenters energiezuiniger te maken. Ze fabriceren ook een koelsysteem voor eenvoudige aansluiting en loskoppeling binnen serverrekken.

“Koeling en chipfabricage gaan hand in hand. Zonder goede koeling oververhitten componenten en falen ze. Energiezuinige datacenters zullen de sleutel zijn tot de toekomst van AI‑computing.”

Chanwoo Park, een professor in werktuigbouw- en lucht- en ruimtevaartkunde aan het Mizzou College of Engineering

Met de steun van $1,5 miljoen aan financiering van de COOLERCHIPS‑initiatief van DOE ontwikkelde het team een twee‑fasen koelsysteem dat warmte van serverchips afvoert via fase‑verandering. Het kan niet‑actief werken zonder energie te verbruiken wanneer minder koeling nodig is, en zelfs in actieve modus verbruikt het systeem zeer weinig energie.

CRAM‑hardware zou AI‑energieverbruik met 1000× kunnen verminderen

Afgelopen zomer ontwikkelden ingenieurs aan de University of Minnesota Twin Cities een geavanceerd hardware‑apparaat3 dat het energieverbruik van AI met ongeveer 1.000 keer kan verminderen.

Dit nieuwe model heet computational random-access memory (CRAM), en hierbij verlaat data het geheugen nooit; het wordt volledig binnen de geheugenarray verwerkt, waardoor de behoefte aan energie‑intensieve en trage datatransfers wordt geëlimineerd.

Na twee decennia onderzoek maakt deze studie deel uit van de inspanningen van het team om voort te bouwen op het gepatenteerde onderzoek van senior‑auteur Jian-Ping Wang naar Magnetic Tunnel Junctions (MTJ)-apparaten. Deze nanogestructureerde apparaten worden gebruikt om sensoren, harde schijven en andere micro‑elektronische systemen zoals Magnetic Random Access Memory (MRAM) te verbeteren.

“Als een uiterst energie‑efficiënt digitaal in‑memory computing‑substraat is CRAM zeer flexibel, omdat berekeningen op elke locatie in de geheugenarray kunnen worden uitgevoerd,” merkte medeauteur Ulya Karpuzcu, universitair hoofddocent in de afdeling Elektrotechniek en Computer Engineering, op. Bovendien kan het worden geherconfigureerd om het beste te passen bij de prestatiebehoeften van verschillende algoritmen.

Door het brein geïnspireerde AI: het stroomverbruik verminderen door menselijke efficiëntie na te bootsen

Dus, zoals we zagen, kijken onderzoekers naar verschillende aspecten van AI om de energieproblemen aan te pakken. Interessant genoeg zoeken ze ook inspiratie in het menselijk brein. Dit is logisch, want AI is de simulatie van menselijke intelligentieprocessen door machines, hoewel het verre van menselijk denken en redeneren is vanwege het vermogen om te generaliseren over variaties, wat “aanzienlijk zwakker is dan menselijke cognitie.”

Het door het brein geïnspireerde onderzoek naar energiereductie omvat het werk van universitair hoofddocent Chang Xu van het Sydney AI Centre van de universiteit, die opmerkte dat LLM’s die de bronnen op volledige capaciteit benutten, zelfs voor eenvoudige taken, niet de juiste aanpak is. Hij legde uit:

“Wanneer je aan een gezond menselijk brein denkt – het activeert niet alle neuronen of gebruikt al zijn hersenvermogen tegelijk. Het werkt met ongelooflijk weinig energie, slechts 20 Watt, ondanks ongeveer 100 miljard neuronen, die het selectief gebruikt uit verschillende hemisferen van het brein om verschillende taken of denkprocessen uit te voeren.” 

Daarom ontwikkelen ze algoritmen die overbodige berekeningen omzeilen en niet automatisch in een hoge versnelling gaan.

In andere gevallen haalde het onderzoek inspiratie uit de neuromodulatie van het brein en creëerde een algoritme genaamd een ‘opslag‑systeem’ om energie met 37% te verminderen zonder enige nauwkeurigheidsdegradatie, de zelfherstellende functie van hersencellen genaamd astrocyten voor hardware‑apparaten, en kreeg een neuromorfische (door het brein geïnspireerde) vorm van computing (memristors) om samen te werken in verschillende subgroepen van neurale netwerken.

Investeren in kunstmatige intelligentie

Een wereldwijd halfgeleiderbedrijf, AMD (AMD ) staat bekend om zijn high‑performance computing, grafische en visualisatietechnologieën. Terwijl het in directe concurrentie staat met AI‑favoriet NVIDIA (NVDA ), wint het snel terrein in de datacenter‑ en AI‑acceleratormarkten. De MI300‑serie richt zich specifiek op generatieve AI‑werkbelastingen en HPC‑toepassingen.

Zijn leidende aanwezigheid in de datacenter‑CPU‑markt, sterke R&D‑focus, omzetgroei, klantenbestand en overnames maken AMD een sterke speler in de sector.

Advanced Micro Devices (AMD )

In 2022 sloot AMD een recorddeal in de chipindustrie ter waarde van $50 miljard met de overname van Xilinx om de leider te worden in high‑performance en adaptieve computing. En recentelijk voltooide het de overname van ZT Systems om de $500‑miljard AI‑accelerator‑kans in datacenters tegen 2028 aan te pakken.

De marktprestaties van AMD maken dit jaar ook een herstel door na te zijn getroffen door tarief‑turbulentie. Op het moment van schrijven worden AMD‑aandelen verhandeld tegen $120, een daling van 6,9% YTD, maar nog steeds ongeveer 47% onder de piek van maart 2024. Met dat heeft het een marktkapitalisatie van $182,34 miljard, een winst per aandeel (TTM) van 1,36 en een koers‑winstverhouding (TTM) van 82,44.

Wat de financiële cijfers betreft, rapporteerde AMD een jaar‑op‑jaar stijging van 36% in omzet tot $7,4 miljard voor Q1 2025, wat CEO Dr. Lisa Su “een uitstekend begin” van het jaar noemde, “ondanks de dynamische macro‑ en regelgevende omgeving.” Deze groei werd gedreven door “uitbreiding van datacenter‑ en AI‑momentum,” voegde ze toe.

In deze periode bedroeg de operationele winst van AMD $806 miljoen, de nettowinst $709 miljoen, en de verwaterde winst per aandeel $0,44. Voor Q2 2025 wordt een omzet van ongeveer $7,4 miljard verwacht. 

Enkele belangrijke ontwikkelingen van het bedrijf omvatten de uitbreiding van strategische partnerschappen met Meta Platforms, Inc. (META ) (Llama), Alphabet Inc. (GOOGL ) (Gemma), Oracle Corporation (ORCL ), Core42, Dell Technologies (DELL ), en anderen. AMD, samen met Nokia, Cisco Systems, Inc. (CSCO ), en Jio, kondigden ook een nieuw Open Telecom AI Platform aan om AI‑gedreven oplossingen te bieden die efficiëntie, veiligheid en mogelijkheden verbeteren.

Deze week hebben AMD en Nvidia samengewerkt met Humain, een AI‑gerichte dochteronderneming van het Public Investment Fund van Saoedi‑Arabije, om halfgeleiders te leveren voor een grootschalig datacenterproject dat naar verwachting een capaciteit van 500 MW zal hebben.

Klik hier voor een lijst van top non‑silicon computing bedrijven.

Laatste trends en ontwikkelingen van Advanced Micro Devices (AMD)

Conclusie

De afgelopen jaren heeft de AI‑mania een explosieve groei doorgemaakt, en dat met goede redenen. Deze technologie heeft immers een enorm potentieel om een breed scala aan sectoren te transformeren, van gezondheidszorg, productie en materiaalkunde tot financiën, entertainment, onderwijs, detailhandel en cyberbeveiliging.

Echter hebben technologische vooruitgang, groeiende adoptie en de daaropvolgende uitbreiding van deze LLM’s geleid tot een aanzienlijke energievraag, wat bijdraagt aan de uitstoot van broeikasgassen (GHG) en klimaatverandering, de economische kosten verhoogt en de duurzaamheid van de technologie beïnvloedt.

Dit vormt een grote uitdaging voor AI. Als we het volledige potentieel willen realiseren in termen van lagere kosten, hogere productiviteit en verbeterde besluitvorming op schaal, moeten de modellen kosteneffectief en duurzaam zijn.

Het goede nieuws is echter dat onderzoekers wereldwijd al hard werken aan het energie‑efficiënt maken van AI, zoals blijkt uit de AI‑aangedreven chip van Oregon State, wat een sterke mogelijkheid aangeeft om innovatie te aligneren met duurzaamheid.

Natuurlijk moeten de voorgestelde technologieën hun grootste obstakel overwinnen om impact in de echte wereld en schaalbaarheid te bereiken. Toch is één ding duidelijk: de groenere AI‑toekomst is haalbaar, en die komt eraan!

Klik hier om alles te leren over investeren in kunstmatige intelligentie.

Gerefereerde studies:

1. Yu, H., Huang, Z., Lamon, S., Wu, J., Zhao, Z., Lin, D., Zhao, H., Zhang, J., Lu, C., Liu, H., Zhang, X., & Zhang, C. (2025). All-optical image transportation through a multimode fibre using a miniaturized diffractive neural network on the distal facet. Nature Photonics, 19, 486–493. https://doi.org/10.1038/s41566-025-01621-4
2. Bandyopadhyay, S., Sludds, A., Krastanov, S., Youssry, A., Zhang, L., Lian, C., Yu, S., Desiatov, B., Burek, M. J., Lukin, M. D., & Lončar, M. (2024). Single-chip photonic deep neural network with forward-only training. Nature Photonics, 18, 1335–1343. https://doi.org/10.1038/s41566-024-01567-z
3. Lv, Y., Zink, B. R., Bloom, R. P., Roy, A., Vaddi, K., Shang, L., & Manipatruni, S. (2024). Experimental demonstration of magnetic tunnel junction-based computational random-access memory. npj Unconventional Computing, 1, 3. https://doi.org/10.1038/s44335-024-00003-3

Gaurav is in 2017 begonnen met het verhandelen van cryptocurrencies en is sindsdien verliefd geworden op de crypto-ruimte. Zijn interesse in alles wat met crypto te maken heeft, heeft hem ertoe gebracht een schrijver te worden die zich specialiseert in cryptocurrencies en blockchain. Al snel vond hij zichzelf werken met crypto-bedrijven en media-uitzendingskanalen. Hij is ook een grote fan van Batman.