Kunstig intelligens
AI møder effektivitet: En ny chip halverer LLM’s energiforbrug

Den fortsatte kunstige intelligens (AI) boom fører til en stigning i datacentre, hvilket skaber et enormt behov for strøm til at drive og køle serverne indeni.
Selvom der er over 8.000 datacentre verden over, hvoraf de fleste er i USA, vil dette antal stige betydeligt i de kommende år.
Ifølge Boston Consulting Groups estimat vil efterspørgslen efter datacentre stige 15 % til 20 % hvert år frem til 2030. På dette tidspunkt forventer firmaet, at de udgør 16 % af den samlede amerikanske strømforbrug, op fra kun 2,5 % før OpenAI’s ChatGPT-udgivelse i 2022.
Samtidig forventer den specielle energi- og AI-rapport fra International Energy Agency (IEA), der blev udgivet i år, at efterspørgslen efter elektricitet fra datacentre verden over vil mindst fordobles inden udgangen af dette årti til omkring 945 TWh. Det svarer næsten til, hvad Japan forbruger i dag.
Den i Paris baserede autonome interstatslige organisation rapporterer, at AI er den største drivkraft bag denne stigning, med et forventet mere end firedoblet elforbrug fra AI-optimerede datacentre inden 2030.
I USA specifikt er strømforbruget fra datacentre allerede på vej til at udgøre omkring halvdelen af væksten i elforbruget mellem nu og 2030. Drevet af AI‑brug vil den amerikanske økonomi, ifølge rapporten, forbruge mere elektricitet til databehandling på det tidspunkt end til fremstilling af alle energikrævende varer samlet.
Denne umættelige energisult udgør et enormt problem for AI‑fremskridt og -adoption. Den lyse side er dog det stigende antal forskere og virksomheder, der arbejder på at reducere AI’s strømforbrug og gøre den mere energieffektiv.
Det interessante ved disse bestræbelser er, at mange af dem bruger AI til at løse deres egne energiproblemer.
Netop denne måned demonstrerede et forskerteam en ny chip, der bruger AI til at reducere energifodaftrykket fra store sprogmodeller (LLM’er) med 50 %, hvilket markerer en væsentlig udvikling i at gøre LLM’er omkostningseffektive og mere bæredygtige at køre.
Ny chip udnytter AI til at reducere LLM’s energiforbrug

Forskere fra Oregon State University College of Engineering udviklede den nye effektive AI‑chip for at løse det massive elforbrugsproblem i LLM‑AI‑applikationer som OpenAI’s GPT-4 og Googles Gemini.
A type of machine learning (ML) model, a large language model (LLM) is pre‑trained on vast amounts of data to perform natural language processing (NLP) tasks like text generation, summarization, simplification, text reasoning, language translation, and more.
De mest populære og udbredte chatbots i dag inkluderer OpenAI’s GPT-4o, o3 og o1, Gemini og Gemma fra Google, Llama fra Meta, R1 og V3 fra DeepSeek, Claude fra Anthropic, Nova fra Amazon, Phi fra Microsoft og Grok fra xAI.
I løbet af de sidste par år har LLM’er fuldstændig transformeret AI‑feltet ved at gøre maskiner i stand til at forstå og generere menneskelignende tekst med større nøjagtighed. Denne udvikling af LLM’er har dog medført en eksponentiel stigning i deres størrelse.
En LLM’s størrelse, målt i antallet af parametre, er den primære driver for dens energiforbrug. Det betyder, at jo større modellen er, desto større er behovet for beregningskraft til træning og inferens.
For eksempel havde ChatGPT-1 lige under 120 millioner parametre, som steg til 175 milliarder parametre med GPT-3 og derefter til omkring 1,8 billioner parametre med GPT-4.
Denne enorme stigning i LLM’ers størrelse og kapacitet betyder, at deres energiforbrug også stiger i et hidtil uset omfang. Ud over modellens størrelse påvirker faktorer som den hardware, der bruges til at træne LLM’erne, træningsvarighed, infrastruktur (dvs. datacentre), databehandling, modeloptimering og algoritmeeffektivitet energiforbruget.
Derfor den nye chip fra OSU‑forskerne. Ifølge Tejasvi Anand, lektor i elektroteknik ved OSU, som også leder Mixed Signal Circuits and Systems Lab på universitetet:
“Problemet er, at den energi, der kræves for at transmittere en enkelt bit, ikke reduceres i samme tempo som efterspørgslen på datahastighed stiger. Det er det, der får datacentre til at bruge så meget strøm.”
For at løse dette problem designede og udviklede holdet en ny chip, der kun bruger halvdelen af energien sammenlignet med konventionelle designs.
Anand og doktorand Ramin Javad præsenterede denne nye teknologi på IEEE Custom Integrated Circuits (CIC) Conference, som blev afholdt i Boston sidste måned. Konferencen, der indeholder fora, paneler, udstillinger og mundtlige præsentationer, er dedikeret til udviklingen af IC’er, som udgør byggestenene i moderne elektroniske systemer ved at levere funktionalitet og behandlingskraft i en kompakt og effektiv pakke.
Den seneste teknologi blev bygget med støtte fra Center for Ubiquitous Connectivity (CUbiC), Semiconductor Research Corporation (SRC) og Defense Advanced Research Projects Agency (DARPA). Den gav også Javadi prisen for bedste studentpapir på konferencen.
For den nye chip udnyttede forskerne faktisk AI‑principper, som ifølge Javadi reducerer elforbruget til signalbehandling.
Som han forklarede, sender og modtager LLM’er store mængder data over ledningsforbindelser, som er kobberbaserede kommunikationslink i datacentre. Hele processen kræver betydelig energi, så en potentiel “løsning er at udvikle mere effektive ledningskommunikationschips.”
Javadi bemærkede yderligere, at når data sendes med høj hastighed, bliver de faktisk korrupteret i modtagerens ende, og som følge heraf skal de renses. Til dette formål anvender de fleste eksisterende ledningskommunikationssystemer en equalizer, som forbruger meget strøm.
“Vi bruger disse AI‑principper på chippen til at gendanne data på en smartere og mere effektiv måde ved at træne den indlejrede klassifikator til at genkende og rette fejlene.”
– Javadi
Selvom det er en stor udvikling, er dette kun den første version af chippen. Dens næste iteration er i øjeblikket under udvikling for yderligere at forbedre dens energieffektivitet.
Samlet set viser denne igangværende forskning stort potentiale for at have vidtrækkende konsekvenser for fremtiden for AI‑infrastruktur og datacenterdrift. Men naturligvis vil det kræve, at teknologien lykkes med implementering i stor skala, hvilket aldrig er en nem opgave.
Klik her for at lære, hvordan AI omvælger mikrochip‑ingeniørkunst.
Tæmning af AI’s energisult med gennembrud på tværs af lag
Denne seneste chip‑udvikling er blot et af mange forskningsprojekter, der tackler AI’s energiforbrugsproblem. Lad os derfor tage et kort kig på de innovative metoder, forskerne har anvendt.
Brug af lys til AI‑energieffektivitet
Tidligere i år udviklede USST‑forskere en mikroskopisk AI‑chip1 mindre end et støvkorn eller et saltkorn, som bruger lys til at behandle data fra fiber‑optiske kabler. Dette lover hurtigere beregninger med lavere energiforbrug.
Chippen manipulerer lys til at udføre beregninger øjeblikkeligt i stedet for at fortolke lyssignaler som traditionelle computere gør. Til dette bruger den en “fuld‑optisk diffraktiv dyb neuralt netværk”, en teknologi, der udnytter mønstrede, 3D‑printede lag af komponenter stablet sammen. Selvom den er banebrydende, skal udfordringer som opgavespecifik design, følsomhed over for ufuldkommenheder og vanskeligheder ved masseproduktion overvindes, før den kan opnå “uhistoriske funktionaliteter” inden for endoskopisk billeddannelse, kvantecomputing og datacentre.
Et par måneder før dette brugte MIT‑forskere også lys til at udføre de centrale operationer i et neuralt netværk på en chip, hvilket muliggør ultrahurtige AI‑beregninger (på en halv nanosekund) med 92 % nøjagtighed og enorm energieffektivitet.
“Dette arbejde demonstrerer, at beregning – i sin essens, kortlægning af input til output – kan kompileres på nye arkitekturer af lineær og ikke‑lineær fysik, som muliggør en fundamentalt anderledes skaleringslov for beregning i forhold til den nødvendige indsats.”
– Seniorforfatter Dirk Englund
Forskere udviklede den fotoniske chip2, som er lavet af sammenkoblede moduler, der danner et optisk neuralt netværk. Bemærkelsesværdigt er, at brugen af kommercielle fundrykningsprocesser til fremstillingen betyder, at den kan skaleres og integreres i elektronik. Desuden overvandt forskerne udfordringen med ikke‑linearitet i optik ved at designe ikke‑lineære optiske funktionsenheder (NOFUs), der kombinerer elektronik og optik.
Et softwareværktøj til AI‑træning & en kølesystem til datacentre

Forskerne fra University of Michigan fokuserede imidlertid på det energispild, der opstår under AI‑træning, specifikt når den fordeles mellem GPU’er, som er nødvendige for at behandle enorme datasæt, på en ujævn måde.
Derfor udviklede de et softwareværktøj kaldet Perseus, som identificerer delopgaver, der vil tage længst tid at fuldføre, og derefter reducerer hastigheden på processorer, der ikke er på denne ‘kritiske sti’, så alle kan fuldføre deres opgaver samtidigt, hvilket fjerner unødvendigt strømforbrug.
Dette open‑source‑værktøj er tilgængeligt som en del af Zeus, et værktøj til måling og optimering af AI‑energiforbrug.
Samtidig vendte forskere fra University of Missouri sig mod udviklingen af et næste‑generations kølesystem for at hjælpe datacentre med at blive mere energieffektive. De fremstiller også et kølesystem, der let kan tilsluttes og frakobles inden for server‑rack.
“Køling og chipproduktion går hånd i hånd. Uden ordentlig køling overopheder komponenterne og fejler. Energieffektive datacentre vil være nøglen til fremtiden for AI‑computing.”
– Chanwoo Park, professor i maskin‑ og rumfartsingeniør ved Mizzou College of Engineering
Med støtte fra $1,5 millioner i finansiering fra DOE’s COOLERCHIPS‑initiativ udviklede holdet et to‑faset kølesystem, der afleder varme fra server‑chips gennem faseændring. Det kan ikke kun køre passivt uden at bruge energi, når mindre køling er påkrævet, men selv i aktiv tilstand bruger systemet kun en meget lille mængde.
CRAM‑hardware kunne reducere AI‑energiforbrug med 1000‑gange
Sidste sommer udviklede ingeniører ved University of Minnesota Twin Cities en avanceret hardwareenhed3, der kunne reducere AI’s energiforbrug med omkring 1.000 gange.
Denne nye model kaldes computational random‑access memory (CRAM), og her forlader data aldrig hukommelsen; i stedet behandles de fuldstændigt inden for hukommelsesarrayet, hvilket eliminerer behovet for energikrævende og langsomme dataoverførsler.
To årtier i udvikling er denne undersøgelse en del af holdets arbejde med at bygge videre på seniorforfatter Jian‑Ping Wangs patenterede forskning i Magnetic Tunnel Junctions (MTJ)-enheder. Disse nanostrukturerede enheder bruges til at forbedre sensorer, harddiske og andre mikroelektroniske systemer som Magnetic Random Access Memory (MRAM).
“Som et ekstremt energieffektivt digitalt in‑memory‑computing‑substrat er CRAM meget fleksibel, idet beregning kan udføres på enhver placering i hukommelsesarrayet,” bemærkede medforfatter Ulya Karpuzcu, lektor i afdelingen for elektroteknik og datateknik. Derudover kan den omkonfigureres for bedst at imødekomme ydeevnebehovene i forskellige algoritmer.
Hjerne‑inspireret AI: Reduktion af strømforbrug ved at efterligne menneskelig effektivitet
Så som vi har set, ser forskere på forskellige aspekter af AI for at håndtere dens energiproblemer. Interessant nok vender de sig også mod den menneskelige hjerne for inspiration. Det giver mening, for AI er simuleringen af menneskelige intelligensprocesser af maskiner, selvom den ikke er i nærheden af menneskelig tænkning og ræsonnement på grund af dens evne til at generalisere på tværs af variationer, hvilket gør den “væsentligt svagere end menneskelig kognition.”
Den hjerne‑inspirerede energireduktion forskning inkluderer arbejdet fra lektor Chang Xu i universitetets Sydney AI‑Center, som bemærkede, at LLM’er, der udnytter ressourcerne på fuld kapacitet, selv for simple opgaver, ikke er den rette måde at gøre tingene på. Han forklarede:
“Når du tænker på en sund menneskelig hjerne – den aktiverer ikke alle neuroner eller bruger al sin hjernekapacitet på én gang. Den fungerer med utrolig energieffektivitet, kun 20 watt, på trods af at have omkring 100 milliarder neuroner, som den selektivt bruger fra forskellige hjernehalvdele til at udføre forskellige opgaver eller tænke.”
Derfor udvikler de algoritmer, der omgår de overflødige beregninger, som ikke er nødvendige, og som ikke automatisk går i høj gear.
I andre tilfælde tog forskningen inspiration fra hjernens neuromodulation og skabte en algoritme kaldet et ‘lagringssystem’, der reducerer energiforbruget med 37 % uden nogen nøjagtighedsnedgang, den selvreparerende funktion af hjernecellen kaldet astrocytter til hardware‑enheder, og fik den neuromorfe (hjerne‑inspirerede) form for computing (memristorer) til at arbejde sammen i flere undergrupper af neurale netværk.
Investering i kunstig intelligens
Et globalt halvlederfirma, AMD (AMD ) er kendt for sine højtydende computer‑, grafik‑ og visualiseringsteknologier. Mens det er i direkte konkurrence med AI‑favoritten NVIDIA (NVDA ), vinder det hurtigt terræn på datacenter‑ og AI‑acceleratormarkederne. Dens MI300‑serie retter sig specifikt mod generativ AI‑arbejdsbelastninger og HPC‑applikationer.
Dens førende tilstedeværelse i datacenter‑CPU‑området, stærke F&U‑fokus, omsætningsvækst, kundebase og opkøb gør AMD til en stærk aktør i sektoren.
Advanced Micro Devices (AMD )
I 2022 indgik AMD en rekordhandel i chip‑industrien til en værdi af 50 milliarder dollars med opkøbet af Xilinx for at blive branchens leder inden for højtydende og adaptiv computing. Og for nylig har de afsluttet opkøbet af ZT Systems for at imødekomme den 500 milliarder dollars store mulighed inden for AI‑acceleratorer i datacentre i 2028.
AMD’s markedspræstation er også ved at komme sig i år efter at være ramt af toldturbulens. På tidspunktet for skrivning handles AMD-aktier til $120, ned 6,9 % år‑til‑dato, men kun omkring 47 % under sit topniveau fra marts 2024. Med dette er dens markedsværdi $182,34 milliarder med en EPS (TTM) på 1,36 og en P/E (TTM) på 82,44.
Hvad angår virksomhedens økonomi, rapporterede AMD en 36 % år‑til‑år stigning i omsætning til $7,4 milliarder for Q1 2025, hvilket administrerende direktør Dr. Lisa Su kaldte “en fremragende start” på året, “trods det dynamiske makro‑ og reguleringsmiljø.” Denne vækst blev drevet af “udvidende datacenter‑ og AI‑momentum,” tilføjede hun.
I denne periode var AMD’s driftsindkomst $806 millioner, nettoindkomst $709 millioner, og fortyndet indtjening pr. aktie $0,44. For Q2 2025 forventes en omsætning på cirka $7,4 milliarder.
Nogle vigtige udviklinger fra virksomheden inkluderer udvidelsen af strategiske partnerskaber med Meta Platforms, Inc. (META ) (Llama), Alphabet Inc. (GOOGL ) (Gemma), Oracle Corporation (ORCL ), Core42, Dell Technologies (DELL ), og andre. AMD, sammen med Nokia, Cisco Systems, Inc. (CSCO ), og Jio, annoncerede også en ny Open Telecom AI Platform for at tilbyde AI‑drevne løsninger, der forbedrer effektivitet, sikkerhed og kapaciteter.
Denne uge har AMD og Nvidia indgået partnerskab med Humain, et AI‑fokuseret datterselskab af Saudi-Arabiens Public Investment Fund, for at levere halvledere til et storskala‑datacenterprojekt, der forventes at have en kapacitet på 500 MW.
Klik her for en liste over de bedste ikke‑silicium‑computing‑virksomheder.
Seneste trends og udviklinger for Advanced Micro Devices (AMD)
Konklusion
I løbet af de sidste par år har AI‑maniakien oplevet eksplosiv vækst, og det med god grund. Denne teknologi har trods alt stort potentiale til at transformere en bred vifte af industrier fra sundhedspleje, fremstilling og materialvidenskab til finans, underholdning, uddannelse, detailhandel og cybersikkerhed.
Dog har teknologisk fremskridt, stigende adoption og efterfølgende udvidelse af disse LLM’er medført et betydeligt energibehov, hvilket bidrager til drivhusgasemissioner (GHG) og klimaændringer, øger økonomiske omkostninger og påvirker teknologiens bæredygtighed.
Dette udgør en stor udfordring for AI. Hvis vi vil realisere dens sande potentiale fuldt ud i form af reducerede omkostninger, øget produktivitet og forbedret beslutningstagning i stor skala, skal modellerne opnå omkostningseffektivitet og bæredygtighed.
Det gode er dog, at forskere verden over allerede arbejder hårdt på at gøre AI energieffektiv, som det fremgår af Oregon State’s AI‑drevne chip, hvilket antyder en stærk mulighed for at forene innovation med bæredygtighed.
Selvfølgelig skal de foreslåede teknologier overvinde deres største forhindring i at opnå reel indvirkning, nemlig skalerbarhed. Alligevel er én ting klar: den grønnere AI‑fremtid er mulig, og den er på vej!
Klik her for at lære alt om investering i kunstig intelligens.
Studier refereret:
1. Yu, H., Huang, Z., Lamon, S., Wu, J., Zhao, Z., Lin, D., Zhao, H., Zhang, J., Lu, C., Liu, H., Zhang, X., & Zhang, C. (2025). All-optical image transportation through a multimode fibre using a miniaturized diffractive neural network on the distal facet. Nature Photonics, 19, 486–493. https://doi.org/10.1038/s41566-025-01621-4
2. Bandyopadhyay, S., Sludds, A., Krastanov, S., Youssry, A., Zhang, L., Lian, C., Yu, S., Desiatov, B., Burek, M. J., Lukin, M. D., & Lončar, M. (2024). Single-chip photonic deep neural network with forward-only training. Nature Photonics, 18, 1335–1343. https://doi.org/10.1038/s41566-024-01567-z
3. Lv, Y., Zink, B. R., Bloom, R. P., Roy, A., Vaddi, K., Shang, L., & Manipatruni, S. (2024). Experimental demonstration of magnetic tunnel junction-based computational random-access memory. npj Unconventional Computing, 1, 3. https://doi.org/10.1038/s44335-024-00003-3












