Tekoäly
Tekoäly kohtaa tehokkuuden: Uusi siru pienentää LLM:n virrankulutusta 50 %
Securities.io noudattaa tiukkoja toimituksellisia standardeja ja voi saada korvausta tarkistetuista linkeistä. Emme ole rekisteröity sijoitusneuvoja, eikä tämä ole sijoitusneuvontaa. Katso lisätietoja tytäryhtiöiden ilmoittaminen.

Jatkuva tekoälybuumi johtaa datakeskusten määrän kasvuun, mikä puolestaan lisää valtavaa kysyntää niissä olevien palvelimien käyttö- ja jäähdytysteholle.
Vaikka maailmassa on yli 8,000 XNUMX datakeskusta, joista suurin osa sijaitsee Yhdysvalloissa, tämä määrä kasvaa huomattavasti tulevina vuosina.
Boston Consulting Groupin arvion mukaan datakeskusten kysyntä kasvaa 15–20 prosenttia vuosittain vuoteen 2030 asti. Yritys odottaa niiden muodostavan tällä hetkellä 16 prosenttia Yhdysvaltojen kokonaisenergiankulutuksesta, kun se ennen OpenAI:n ChatGPT-julkaisua vuonna 2.5 oli vain 2022 prosenttia.
Samaan aikaan, energia- ja tekoälyraportin Kansainvälisen energiajärjestön (IEA) tänä vuonna julkaiseman raportin mukaan datakeskusten sähkönkulutus ympäri maailmaa ainakin kaksinkertaistuu tämän vuosikymmenen loppuun mennessä noin 945 terawattituntiin. Tämä on lähes sama kuin Japanin nykyinen kulutus.
Pariisissa toimiva autonominen hallitustenvälinen järjestö raportoi tekoälyn olevan tämän piikin suurin ajuri, ja tekoälyn avulla optimoitujen datakeskusten sähkönkulutuksen ennustetaan yli nelinkertaistuvan vuoteen 2030 mennessä.
Erityisesti Yhdysvalloissa datakeskusten sähkönkulutuksen odotetaan jo muodostavan noin puolet sähkönkulutuksen kasvusta nykyhetkestä vuoteen 2030. Raportin mukaan tekoälyn käytön vauhdittamana Yhdysvaltain talous kuluttaa tuolloin enemmän sähköä datan käsittelyyn kuin kaikkien energiaintensiivisten tuotteiden valmistukseen yhteensä.
Tämä kyltymätön energianhimo on valtava ongelma tekoälyn kehittämisessä ja käyttöönotossa. Hyvä puoli on kuitenkin se, että yhä useammat tutkijat ja yritykset työskentelevät tekoälyn energiankulutuksen vähentämiseksi ja sen energiatehokkuuden parantamiseksi.
Mielenkiintoista näissä pyrkimyksissä on se, että monet niistä hyödyntävät tekoälyä omien energiahaasteidensa ratkaisemiseen.
Juuri tässä kuussa tutkijaryhmä esitteli uuden sirun, joka käyttää tekoälyä pienentääkseen suurten kielimallien (LLM) energiajalanjälkeä 50 prosentilla. Tämä on merkittävä edistysaskel LLM-järjestelmien kustannustehokkuuden ja kestävän kehityksen kannalta.
Uusi siru hyödyntää tekoälyä vähentääkseen oikeustieteen maisterin energiankulutusta

Oregonin osavaltionyliopiston teknillisen tiedekunnan tutkijat kehittivät uuden tehokkaan tekoälysirun ratkaisemaan LLM-tekoälysovellusten, kuten OpenAI:n GPT-4:n ja Googlen Geminin, valtavan sähkönkulutusongelman.
Koneoppimiseen (ML) perustuva laaja kielimalli (LLM) on esikoulutettu valtavien tietomäärien pohjalta suorittamaan luonnollisen kielen käsittelyyn (NLP) liittyviä tehtäviä, kuten tekstin luomista, yhteenvetoa, yksinkertaistamista, tekstin päättelyä, kielen kääntämistä ja paljon muuta.
Nykyään suosituimpia ja laajimmin käytettyjä chatbotteja ovat OpenAI:n GPT-4o, o3 ja o1, Googlen Gemini ja Gemma, Metan Llama, DeepSeekin R1 ja V3, Anthropicin Claude, Amazonin Nova, Microsoftin Phi ja xAI:n Grok.
Viime vuosina oikeustieteen maisterit (LLM) ovat mullistaneet tekoälyn alan täysin mahdollistamalla koneiden ymmärtää ja tuottaa ihmismäistä tekstiä suuremmalla tarkkuudella. Tämä LLM-ohjelmien kehitys on kuitenkin johtanut niiden koon eksponentiaaliseen kasvuun.
LLM:n koko, jota mitataan sen parametrien lukumäärällä, on sen energiankulutuksen tärkein ajuri. Tämä tarkoittaa, että mitä suurempi malli on, sitä suurempi on sen laskentatehon tarve koulutukseen ja päättelyyn.
Esimerkiksi ChatGPT-1:ssä oli hieman alle 120 miljoonaa parametria, joka nousi 175 miljardiin parametriin GPT-3:ssa ja sitten noin 1.8 biljoonaan parametriin GPT-4:ssä.
Tämä valtava LLM-järjestelmien koon ja suorituskyvyn kasvu tarkoittaa, että myös niiden energiankulutus kasvaa ennennäkemättömässä mittakaavassa. Mallin koon lisäksi LLM-järjestelmien energiankulutukseen vaikuttavat tekijät, kuten näiden LLM-järjestelmien kouluttamiseen käytetyn laitteiston tyyppi, koulutusprosessin kesto, infrastruktuuri eli datakeskukset, tietojenkäsittely, mallin optimointi ja algoritmien tehokkuus.
Tästä syystä OSU:n tutkijoiden uusi siru. Tejasvi Anandin, OSU:n sähkötekniikan apulaisprofessorin ja yliopiston sekasignaalipiirien ja -järjestelmien laboratorion johtajan mukaan:
”Ongelmana on, että yhden bitin lähettämiseen tarvittava energia ei vähene samassa tahdissa kuin tiedonsiirtonopeusvaatimus kasvaa. Tämä aiheuttaa sen, että datakeskukset käyttävät niin paljon virtaa.”
Tämän ongelman ratkaisemiseksi tiimi suunnitteli ja kehitti uuden sirun, joka kuluttaa vain puolet energiasta perinteisiin malleihin verrattuna.
Anand ja tohtoriopiskelija Ramin Javad esittelivät tätä uutta teknologiaa IEEE Custom Integrated Circuits (CIC) -konferenssissa, joka pidettiin Bostonissa viime kuussa. Konferenssissa, jossa järjestetään foorumeita, paneelikeskusteluja, näyttelyitä ja suullisia esityksiä, keskitytään integroitujen piirien (IC) kehittämiseen. CIC toimii nykyaikaisten elektronisten järjestelmien rakennuspalikkana tarjoamalla toiminnallisuutta ja prosessointitehoa kompaktissa ja tehokkaassa paketissa.
Uusin teknologia rakennettiin Center for Ubiquitous Connectivity (CUbiC), Semiconductor Research Corporation (SRC) ja Defense Advanced Research Projects Agency (DARPA) -järjestön tuella. Se toi Javadille myös konferenssissa parhaan opiskelijapaperin palkinnon.
Uuden sirun osalta tutkijat hyödynsivät tekoälyn periaatteita, jotka Javadin mukaan vähentävät signaalinkäsittelyn sähkönkulutusta.
Kuten hän selitti, LLM:t lähettävät ja vastaanottavat paljon dataa langallisten yhteyksien kautta, jotka ovat kuparipohjaisia tietoliikenneyhteyksiä datakeskuksissa. Koko tämä prosessi vaatii merkittävästi energiaa, joten yksi mahdollinen "ratkaisu on kehittää tehokkaampia langallisia tietoliikennepiirejä".
Javadi huomautti lisäksi, että suurilla nopeuksilla lähetettäessä data itse asiassa vioittuu vastaanottimen päässä, ja siksi se on puhdistettava. Tätä tarkoitusta varten useimmat olemassa olevat langalliset viestintäjärjestelmät käyttävät taajuuskorjainta, joka kuluttaa paljon virtaa.
"Käytämme näitä tekoälyn periaatteita sirulla palauttaaksemme tiedot älykkäämmällä ja tehokkaammalla tavalla kouluttamalla sirun luokittelijaa tunnistamaan ja korjaamaan virheet."
– Javadi
Vaikka kyseessä on iso kehitysaskel, tämä on vasta sirun ensimmäinen versio. Sen seuraavaa versiota kehitetään parhaillaan energiatehokkuuden parantamiseksi entisestään.
Kaiken kaikkiaan tämä meneillään oleva tutkimus osoittaa suurta potentiaalia olla kauaskantoisia vaikutuksia tekoälyinfrastruktuurin ja datakeskusten toiminnan tulevaisuuteen. Mutta se edellyttäisi tietenkin teknologian onnistunutta käyttöönottoa laajamittaisesti, mikä ei ole koskaan helppo tehtävä.
Klikkaa tästä ja lue lisää siitä, miten tekoäly mullistaa mikrosirujen suunnittelun.
Tekoälyn energianhimoa kesytetään läpimurroilla eri tasojen välillä
Tämä viimeisin sirukehitys on vain yksi monista tekoälyn energiankulutusongelmaan puuttuvista tutkimusprojekteista. Katsotaanpa siis lyhyesti innovatiivisia tapoja, joilla tutkijat ovat ratkaisseet sen.
Valon käyttö tekoälyn energiatehokkuuteen
Aiemmin tänä vuonna USST:n tiedemiehet kehitetty1 mikroskooppinen tekoälysiru, joka on pienempi kuin pölyhiukkanen tai suolanjyvä, ja joka käyttää valoa valokuitukaapeleista tulevan datan käsittelyyn. Tämä lupaa nopeampia laskentoja pienemmällä energiankulutuksella.
Siru manipuloi valoa suorittaakseen laskutoimituksia välittömästi sen sijaan, että se tulkitsisi valosignaaleja kuten perinteiset tietokoneet. Tätä varten se käyttää "täysin optista diffraktiivista syvähermoverkkoa", tekniikkaa, joka hyödyntää kuvioituja, 3D-tulostettuja komponenttikerroksia, jotka on pinottu yhteen. Vaikka tämä on uraauurtavaa, sen on voitettava haasteita, kuten tehtäväkohtainen suunnittelu, herkkyys epätäydellisyyksille ja vaikeudet tuottaa laajamittaisesti, jotta se saavuttaisi "ennennäkemättömät toiminnot" endoskooppisessa kuvantamisessa, kvanttilaskennassa ja datakeskuksissa.
Muutamaa kuukautta aiemmin MIT:n tutkijat käyttivät valoa myös neuroverkon keskeisten toimintojen suorittamiseen sirulla, mikä mahdollisti erittäin nopeat tekoälylaskennan suoritukset (puolessa nanosekunnissa) 92 %:n tarkkuudella ja valtavalla energiatehokkuudella.
”Tämä työ osoittaa, että laskenta – pohjimmiltaan syötteiden ja tulosteiden yhdistäminen – voidaan kääntää lineaarisen ja epälineaarisen fysiikan uusille arkkitehtuureille, jotka mahdollistavat perustavanlaatuisesti erilaisen skaalauslain laskennan ja tarvittavan työmäärän välillä.”
– Vanhempi kirjailija Dirk Englund
Tutkijat kehitti fotonisirun2, joka koostuu toisiinsa kytketyistä moduuleista, jotka muodostavat optisen neuroverkon. Merkittävää on, että kaupallisten valimoprosessien käyttö sen valmistuksessa tarkoittaa, että sitä voidaan skaalata ja integroida elektroniikkaan. Lisäksi tutkijat ratkaisivat optiikan epälineaarisuuden haasteen suunnittelemalla epälineaarisia optisia funktioyksiköitä (NOFU), jotka yhdistävät elektroniikan ja optiikan.
Ohjelmistotyökalu tekoälyn koulutukseen ja jäähdytysjärjestelmä datakeskuksiin

Samaan aikaan Michiganin yliopiston tutkijat kohdistui energian hukkaan syntyy tekoälyn koulutuksen aikana, tarkemmin sanottuna silloin, kun se jaetaan epätasaisesti näytönohjainten kesken, mikä on välttämätöntä valtavien tietojoukkojen käsittelyssä.
Niinpä he kehittivät Perseus-nimisen ohjelmistotyökalun, joka tunnistaa pisimmän ajan suorittamiseen kuluvat alitehtävät ja sitten hidastaa niiden prosessorien nopeutta, jotka eivät ole tällä "kriittisellä polulla", jotta ne kaikki voivat suorittaa tehtävänsä samanaikaisesti, mikä poistaa tarpeettoman virrankulutuksen.
Tämä avoimen lähdekoodin työkalu on saatavilla osana Zeusta, työkalua tekoälyn energiankulutuksen mittaamiseen ja optimointiin.
Samaan aikaan Missourin yliopiston tutkijat kääntyivät puoleensa suunnittelemassa seuraavan sukupolven jäähdytysjärjestelmää auttaakseen datakeskuksia parantamaan energiatehokkuuttaan. He valmistavat myös jäähdytysjärjestelmää, joka helpottaa palvelinräkkien kytkentää ja irrottamista.
”Jäähdytys ja sirujen valmistus kulkevat käsi kädessä. Ilman asianmukaista jäähdytystä komponentit ylikuumenevat ja rikkoutuvat. Energiatehokkaat datakeskukset ovat avainasemassa tekoälylaskennan tulevaisuudessa.”
- Chanwoo Park, kone- ja ilmailutekniikan professori Mizzoun teknillisessä korkeakoulussa
Energiaministeriön COOLERCHIPS-aloitteen 1.5 miljoonan dollarin tuella tiimi kehitti kaksivaiheisen jäähdytysjärjestelmän, joka johtaa lämpöä palvelinpiiristä faasimuutoksen avulla. Järjestelmä ei ainoastaan toimi passiivisesti kuluttamatta energiaa tarvittaessa, mikä vähentää jäähdytystä, vaan se käyttää myös aktiivisessa tilassa hyvin pienen määrän energiaa.
CRAM-laitteisto voisi vähentää tekoälyn energiankulutusta tuhanskertaisesti
Viime kesänä Minnesotan yliopiston kaksoiskaupunkien insinöörit kehitti edistyneen laitteiston3 joka voisi vähentää tekoälyn energiankulutusta noin 1,000 XNUMX-kertaisesti.
Tätä uutta mallia kutsutaan laskennalliseksi RAM-muistiksi (CRAM), ja tässä data ei koskaan poistu muistista; pikemminkin se käsitellään kokonaan muistimatriisin sisällä, mikä eliminoi energiaintensiivisten ja hitaiden tiedonsiirtojen tarpeen.
Tämä kahden vuosikymmenen aikana tehty tutkimus on osa tiimin pyrkimyksiä rakentaa vanhemman kirjoittajan Jian-Ping Wangin patentoidun tutkimuksen pohjalle magneettisista tunneliliitoksista (MTJ). Näitä nanorakenteisia laitteita käytetään antureiden, kiintolevyjen ja muiden mikroelektronisten järjestelmien, kuten magneettisen RAM-muistin (MRAM), parantamiseen.
”Erittäin energiatehokkaana digitaalisena muistipohjaisena laskentaympäristönä CRAM on erittäin joustava, koska laskentaa voidaan suorittaa missä tahansa muistimatriisin kohdassa”, totesi toinen kirjoittaja, sähkö- ja tietokonetekniikan laitoksen apulaisprofessori Ulya Karpuzcu. Lisäksi sitä voidaan konfiguroida uudelleen vastaamaan parhaiten eri algoritmien suorituskykytarpeita.
Aivojen inspiroima tekoäly: Virrankulutuksen vähentäminen matkimalla ihmisen tehokkuutta
Kuten näimme, tutkijat tarkastelevat tekoälyn eri puolia sen energiaongelmien ratkaisemiseksi. Mielenkiintoista kyllä, he hakevat inspiraatiota myös ihmisaivoista. Tämä on järkevää, sillä tekoäly on loppujen lopuksi koneiden simuloimaa ihmisen älykkyysprosessia, vaikka se onkin... ei lähelläkään ihmisen ajattelua ja päättelyä koska sen kyky yleistyä variaatioiden välillä on "merkittävästi heikompi kuin ihmisen kognitio".
Aivojen inspiroimaan energiansäästötutkimukseen sisältyy Sydneyn yliopiston tekoälykeskuksen apulaisprofessori Chang Xun työ. Hän totesi, että LLM:ien ei ole oikea tapa tehdä asioita, jos he hyödyntävät resursseja täydellä teholla edes yksinkertaisissa tehtävissä. Hän selitti:
”Kun ajattelee terveitä ihmisaivoja – ne eivät aktivoi kaikkia hermosoluja tai käytä kaikkea aivokapasiteettiaan kerralla. Ne toimivat uskomattoman energiatehokkaasti, vain 20 watin teholla, vaikka niissä on noin 100 miljardia hermosolua, joita ne käyttävät valikoivasti aivojen eri puoliskoilta erilaisten tehtävien suorittamiseen tai ajatteluun.”
Sellaisenaan he kehittävät algoritmeja, jotka ohittavat tarpeettomat laskelmat eivätkä mene automaattisesti korkealle vaihteelle.
Muissa tapauksissa tutkimus sai inspiraatiota aivojen neuromodulaatiosta ja loi algoritmin nimeltä "varastointijärjestelmä'vähentääkseen energiankulutusta 37 % ilman tarkkuuden heikkenemistä, aivosolujen itsekorjautuva toiminto, nimeltään astrosyytit laitteistoilleja saivat neuromorfisen (aivoista inspiroituneen) laskennan muodon (memristorit) työskennellä yhdessä useissa neuroverkkojen alaryhmissä.
Investointi tekoälyyn
Globaali puolijohdeyritys, AMD (AMD ) tunnetaan tehokkaista laskenta-, grafiikka- ja visualisointiteknologioistaan. Vaikka se kilpailee suoraan tekoälyn suosikin kanssa NVIDIA (NVDA )Se on nopeasti valtaamassa jalansijaa datakeskusten ja tekoälykiihdyttimien markkinoilla. Sen MI300-sarja on suunnattu erityisesti sukupolven tekoälytyökuormille ja HPC-sovelluksille.
Sen johtava asema datakeskusten suorittimien markkinoilla, vahva keskittyminen tutkimukseen ja kehitykseen, liikevaihdon kasvu, asiakaskunta ja yritysostot tekevät AMD:stä vahvan toimijan alalla.
Advanced Micro Devices (AMD )
Vuonna 2022 AMD teki ennätyksellisen 50 miljardin dollarin arvoisen sirualan sopimuksen ostamalla Xilinxin ja noustakseen alan tehokkaan ja mukautuvan laskennan johtajaksi. Ja viimeisimpänä se saattoi päätökseen ZT Systemsin oston hyödyntääkseen 500 miljardin dollarin arvoisen datakeskusten tekoälykiihdyttämön potentiaalin vuonna 2028.
Myös AMD:n markkinasuorituskyky on elpymässä tänä vuonna tariffiturbulenssin koettelemana. Kirjoitushetkellä AMD:n osakkeiden hinta on 120 dollaria, mikä on 6.9 % laskua vuodentakaisesta, mutta vain noin 47 % vähemmän kuin maaliskuun 2024 huippulukemissa. Tämän ansiosta sen markkina-arvo on 182.34 miljardia dollaria, osakekohtainen tulos (TTM) 1.36 ja P/E (TTM) 82.44.
Yhtiön taloustietojen osalta AMD raportoi liikevaihdon kasvaneen 36 % edellisvuodesta 7.4 miljardiin dollariin vuoden 1 ensimmäisellä neljänneksellä. Toimitusjohtaja Dr. Lisa Su kutsui tätä vuoden ”erinomaiseksi aluksi” dynaamisesta makrotaloudellisesta ja sääntely-ympäristöstä huolimatta. Kasvua vauhditti ”datakeskusten ja tekoälyn vauhdin laajeneminen”, hän lisäsi.
Tänä aikana AMD:n liikevoitto oli 806 miljoonaa dollaria, nettotulos 709 miljoonaa dollaria ja laimennettu osakekohtainen tulos 0.44 dollaria. Vuoden 2 toiselle neljännekselle se ennustaa noin 2025 miljardin dollarin liikevaihtoa.
Joitakin yhtiön keskeisiä kehitysaskeleita ovat strategisten kumppanuuksien laajentaminen mm. Meta Platforms Inc. (META ) (Laama), Alphabet Inc. (GOOGL ) (Gemma) Oracle Corporation (ORCL ), Core42, Dell-teknologiat (DELL )ja muut. AMD ja Nokia Cisco Systems, Inc. (CSCO )ja Jio ilmoittivat myös uudesta Open Telecom AI Platform -alustasta, joka tarjoaa tekoälypohjaisia ratkaisuja tehokkuuden, turvallisuuden ja ominaisuuksien parantamiseksi.
Nyt tällä viikolla AMD ja Nvidia solmivat yhteistyön Saudi-Arabian julkisen investointirahaston tekoälyyn keskittyneen tytäryhtiön Humainin kanssa toimittaakseen puolijohteita laajamittaiseen datakeskushankkeeseen, jonka kapasiteetin odotetaan olevan 500 MW.
Klikkaa tästä nähdäksesi luettelon parhaista ei-piipohjaisista tietokoneyrityksistä.
Uusimmat edistyneiden mikrolaitteiden (AMD) trendit ja kehitysaskeleet
Yhteenveto
Viime vuosina tekoälymania on kasvanut räjähdysmäisesti, eikä syyttä. Tällä teknologialla on loppujen lopuksi valtava potentiaali mullistaa laaja kirjo toimialoja terveydenhuollosta, valmistuksesta ja materiaalitieteestä rahoitukseen, viihteeseen, koulutukseen, vähittäiskauppaan ja kyberturvallisuuteen.
Teknologinen kehitys, kasvava käyttöönotto ja näiden LLM-menetelmien myöhempi laajentuminen ovat kuitenkin johtaneet huomattavaan energian kysyntään, mikä lisää kasvihuonekaasupäästöjä ja ilmastonmuutosta, lisää taloudellisia kustannuksia ja vaikuttaa teknologian kestävyyteen.
Tämä on suuri haaste tekoälylle. Jos haluamme hyödyntää sen todellisen potentiaalin täysimääräisesti kustannusten alentamisen, tuottavuuden lisääntymisen ja päätöksenteon parantamisen muodossa laaja-alaisesti, mallien on saavutettava kustannustehokkuutta ja kestävyyttä.
Hyvä asia on kuitenkin se, että tutkijat ympäri maailmaa työskentelevät jo ahkerasti tekoälyn energiatehokkuuden eteen, kuten Oregonin osavaltion tekoälyllä toimivasta sirusta käy ilmi. Tämä viittaa vahvaan mahdollisuuteen yhdistää innovaatiot kestävään kehitykseen.
Ehdotettujen teknologioiden on tietenkin voitettava suurin este reaalimaailman vaikuttavuuden saavuttamiseksi, skaalautuvuus. Yksi asia on kuitenkin selvä: vihreämpi tekoälytulevaisuus on mahdollinen, ja se on tulossa!
Napsauta tätä saadaksesi lisätietoja tekoälyyn sijoittamisesta.
Viittaustutkimukset:
1. Yu, H., Huang, Z., Lamon, S., Wu, J., Zhao, Z., Lin, D., Zhao, H., Zhang, J., Lu, C., Liu, H., Zhang, X., & Zhang, C. (2025). Täysin optinen kuvansiirto monimuotoisen kuidun kautta käyttäen miniatyyrikokoista diffraktiivista neuroverkkoa distaalisella fasetilla. Nature Photonics, 19, 486–493. https://doi.org/10.1038/s41566-025-01621-4
2. Bandyopadhyay, S., Sludds, A., Krastanov, S., Youssry, A., Zhang, L., Lian, C., Yu, S., Desiatov, B., Burek, MJ, Lukin, MD ja Lončar, M. (2024). Yhden sirun fotoninen syväneuroverkko, jossa on vain eteenpäin suuntautuva koulutus. Nature Photonics, 18, 1335–1343. https://doi.org/10.1038/s41566-024-01567-z
3. Lv, Y., Zink, BR, Bloom, RP, Roy, A., Vaddi, K., Shang, L., & Manipatruni, S. (2024). Magneettiseen tunneliliitokseen perustuvan laskennallisen RAM-muistin kokeellinen demonstraatio. npj Unconventional Computing, 1, 3. https://doi.org/10.1038/s44335-024-00003-3










