Tekoäly
Sijoittaminen AI-laitteistoon: CPU:ista XPU:ihin

Sijoittaminen AI-laitteistoon: Pickien ja lapioiden lähestymistapa
AI on lupaava olevan tärkein muutos taloudessamme, tuottavissa järjestelmissä ja yhteiskunnassa viime vuosikymmeninä, mahdollisesti tehden jopa Internetin radikaalit muutokset vähäisiksi vertailussa.
Se saattaa poistaa kokonaisen työnkategorian, kuten kuljettajat, kääntäjät, asiakastuki, verkkosuunnittelijat jne. Muita töitä saattaa kokea radikaalia kysynnän vähenemistä, kuten ohjelmoijat, aloitustason juristit, diagnostiikat jne.
Sen tulisi myös luoda paljon lisäarvoa ja tuottavuutta moniin muihin tehtäviin, ja hallitsevat AI-ohjelmistoyritykset todennäköisesti ovat ensimmäisiä, jotka saavuttavat markkina-arvostuksia, jotka olivat aiemmin käsittämättömiä.
Kaikkien näiden syiden vuoksi pääomamarkkinat ja sijoittajat ovat lumoutuneet tekoälystä ja kiinnittävät suurta huomiota monien teknologiayritysten AI-edistymiseen, sekä vahvaan kilpailuun, jonka kiinalaiset teknologiavalmistajat, kuten Alibaba ja startupit, kuten DeepSeek, tuovat.
Toinen tapa hyödyntää AI-kuumetta on noudattaa strategiaa, joka on toiminut jokaisessa kultaryntäyksessä: älä etsi kultaa, vaan myy pickit ja lapioita. Tämä on varmasti toiminut yrityksille, jotka sattuvat olemaan parhaassa paikassa myydä AI-optimoitua laitteistoa, kun Nvidia (NVDA ) on muuttanut pelkästään pelikorttinsa AI-koulutuspiriksi, tehden siitä maailman arvokkaimman yrityksen, ylittäen hämmästyttävän $4T markkina-arvon (seuraa linkkiä saadaksesi täyden raportin Nvidiasta).
Koska AI vaatii erittäin erityistä laitteistoa, joka poikkeaa suurimmaksi osaksi muista aiemmista laskentatehtävistä, ja on niin massiivinen liiketoimintamahdollisuus, puolijohdeteollisuus on nyt kilpailemassa uusien laitteistomuotojen kehittämisestä, jotka on suunniteltu erityisesti AI-ohjelmien kouluttamiseen ja suorittamiseen.
Vaikka Nvidia todennäköisesti pysyy alansa huippuyrityksenä, vaihtoehdot ovat nyt nousemassa ja voivat tarjota mielenkiintoisia mahdollisuuksia sijoittajille, jotka kiinnittävät huomiota varhaisessa vaiheessa.
Miksi AI tarvitsee erikoislaitteistoa
Monia pieniä laskelmia
Alkuperäiset AI-pyrkimykset käyttivät samaa laskentatehoa kuin muut ohjelmat, keskittyen enimmäkseen prosessoreihin (Central Processing Unit – CPU). CPU:t ovat edelleen tärkeitä, mutta nopeasti kävi ilmi, että ne eivät ole optimaalisia suurimmalle osalle nykyisin AI-kehityksessä käytetyistä menetelmistä.
Neuroverkot ja muut vastaavat menetelmät vaativat paljon suhteellisen yksinkertaisia laskelmia yhden erittäin monimutkaisen laskelman sijaan. Siksi useat pienemmät sirut, jotka toimivat rinnakkain, ovat yleensä parempia kuin massiiviset ja tehokkaat CPU:t.
Tämä on suurimmaksi osaksi syy siihen, miksi GPU:t nousivat nopeasti suositummiksi, sillä grafiikkakortit on luontaisesti suunniteltu suorittamaan tuhansia pienempiä laskelmia rinnakkain.
Nykyinen AI-koulutus perustuu suurelta osin neuroverkkoihin, käsitteeseen, joka voitti Nobel-palkinnon fysiikassa vuonna 2024, palkinnon jonka käsittelimme yksityiskohtaisesti omassa artikkelissamme.

Lähde: Nobel Prize
Toinen vallankumous AI-teknologiassa tuli “transformereiden” myötä. Ne ratkaisevat perinteisten neuroverkkojen kyvyttömyyden käsitellä tehokkaasti pitkiä datasekvenssejä, mikä on yleinen piirre kaikissa luonnollisissa kielissä.
Ensimmäisen kerran esitelty vuonna 2017 Googlen tutkijoiden toimesta, se on nykyisen AI-kapasiteetin räjähdyksen perimmäinen syy. Transformerit ovat AI-tuotteiden, kuten LLM:ien (Large Language Models), mukaan lukien ChatGPT, ytimessä.
Eri vaatimukset
Yksi tärkeä ero AI-työnkuluissa on hienosäädön ja inferenssin välinen ero, joilla kummallakin on omat laitteistovaatimuksensa.
- Hienosäätö sisältää mallin kouluttamisen toimialakohtaiseen dataan, mikä vaatii merkittävää laskentatehoa ja muistia. Se on erittäin tekninen tehtävä, usein AI-tieteen aivan kärjessä.
- Inferenssi keskittyy jo koulutetun mallin käyttämiseen tulosten tuottamiseen, vaatii vähemmän laskentatehoa, mutta korostaa alhaista viivettä ja kustannustehokkuutta.
- Tätä tekee tavallisemmin AI-asiantuntijat, jotka ottavat käyttöön valmiita malleja ratkaistakseen todellisia ongelmia.
Joten, vaikka kustannukset ovat ilmiselvästi huolenaihe sekä hienosäädölle/koulutukselle että inferenssille/AI:n käytölle, koulutus vaatii usein parasta mahdollista laitteistoa, kun taas käyttötehtävät keskittyvät enemmän laitteiston ja energian kulutuksen kustannuksiin parhaan vaihtoehdon valinnassa.
CPU:t vs GPU:t
Keskusprosessorit (CPU:t):
CPU:t ovat yleiskäyttöisiä eivätkä ole erityisesti AI-laitteistoja. Ne ovat kuitenkin edelleen välttämättömiä ohjeiden suorittamisessa ja peruslaskelmien tekemisessä AI-järjestelmissä.
Suurin osa ohjelmistosta, joka käsittelee AI-järjestelmän loppukäyttäjien käyttöliittymää, on myös CPU-keskeistä, olipa kyseessä yksittäiset tietokoneet tai pilvipohjaiset ohjelmistot.

Lähde: AnandTech
CPU:ita voidaan käyttää myös hyvin yksinkertaisiin AI:hin, joissa erikoislaitteistoa ei oikeastaan tarvita. Tämä pätee erityisesti, kun tulos ei ole kiireellinen, eikä CPU:n suhteellisen hidas AI-prosessointi ole ongelma.
Pienet mallit, joissa on pieniä datamääriä ja laskentaa, voivat toimia hyvin CPU:illa. CPU:iden läsnäolo tavallisissa tietokoneissa tekee niistä hyvän vaihtoehdon keskimääräiselle käyttäjälle, joka ei halua sijoittaa AI-spesifiseen laitteistoon.
CPU:t ovat myös erittäin luotettavia ja vakaita, mikä tekee niistä hyvän valinnan kriittisiin tehtäviin, joissa virheettömyys on tärkeä kriteeri.
Lopuksi, CPU:t ovat hyödyllisiä joissakin AI-koulutuksen tehtävissä, yleensä yhteistyössä muiden laitteistotyyppien kanssa, kuten datan lataus, muotoilu, suodatus ja visualisointi.
Grafiikkaprosessorit (GPU:t):
Alun perin grafiikan renderöintiin suunnitellut GPU:t on suunniteltu rinnakkaislaskentaan, mikä tekee niistä ihanteellisia AI-mallien kouluttamiseen, jotka vaativat suurten tietoaineistojen käsittelyä. Siirtyminen CPU:ista GPU:ihin on lyhentänyt koulutusaikoja viikoista tunteihin.
Laajan saatavuuden ja IT-asiantuntijoiden kokemuksen ansiosta GPU:t olivat ensimmäinen laitteistotyyppi, joka otettiin käyttöön sarjassa AI-tutkimuksen skaalaamiseksi.

Lähde: Aorus
Myös GPU:iden menestykseen vaikuttanut tekijä oli Nvidian kehittämä CUDA, yleiskäyttöinen ohjelmointirajapinta Nvidian GPU:ille, avaten oven muille käyttötarkoituksille kuin pelaamiseen. Tämä tehtiin, koska jotkut tutkijat käyttivät jo GPU:ita laskentaan perinteisten supertietokoneiden sijaan.
“Tutkijat huomasivat, että ostamalla tämän GeForce-pelikäytön, lisäämällä sen tietokoneeseen, saa käytännössä henkilökohtaisen supertietokoneen.
Molekyylidynamiikka, seisminen prosessointi, CT-rekonstruktio, kuvanprosessointi—koko joukko erilaisia asioita.”
Tänä päivänä GPU:t ovat edelleen yksi kysytyimmistä AI-laitteistotyypeistä, ja Nvidia juuri ja juuri onnistuu tuottamaan tarpeeksi vastatakseen teknologiajättien, jotka rakentavat gigawatti‑mittakaavan AI‑datakeskuksia, kysyntään.
Se on myös “super‑GPU‑kauden” alku, kun Nvidia on äskettäin julkaissut GB200 NVL72:n.
Tämä laitteisto on suunniteltu toimimaan yhtenä massiivisena GPU:nana suoraan tehtaalta, sen sijaan että pitäisi verkottaa monia pieniä. Se tekee siitä paljon voimakkaamman kuin aiemmin ennätyksellisen H100‑mallin.

Lähde: Nvidia
Tämän tulisi myös olla paljon energiatehokkaampi, mikä on ratkaisevaa, sillä AI-ala saattaa kohdata energian puutetta ennen kuin sirujen puute ilmenee AI‑datakeskusten nopean rakentamisen tahdissa. Lisää laskenta‑ ja energiatehokkuutta tarkoittaa vähemmän hukkaenergiaa, mikä tilapäisesti ratkaisee ylikuumenemisongelman.
| Laitteistotyyppi | Paras käyttötapaus | Nopeus | Energiatehokkuus | Joustavuus |
|---|---|---|---|---|
| CPU | Yleiskäyttöiset tehtävät | Matala | Korkea | Erittäin korkea |
| GPU | AI‑koulutus ja rinnakkaistehtävät | Korkea | Keskitaso | Keskitaso |
| TPU | Tensor‑toiminnot ja transformerit | Erittäin korkea | Korkea | Matala |
| ASIC | Yksittäisen tehtävän kiihdytys | Erittäin korkea | Erittäin korkea | Erittäin matala |
| FPGA | Uudelleenkonfiguroitavat AI‑työkuormat | Keskitaso | Keskitaso | Korkea |
ASIC:iden ja AI-laitteiston nousu
Application‑Specific Integrated Circuits (ASIC:t) ovat laskentalaitteistoja, jotka on suunniteltu erityisesti tiettyyn laskentatehtävään, tehden niistä vielä erikoistuneempia kuin edelleen melko yleiskäyttöiset GPU:t.
Ne ovat siis vähemmän joustavia ja ohjelmoitavia kuin yleiskäyttöinen laitteisto.
Yleisesti ne ovat monimutkaisempia. Ne ovat myös yleensä kalliimpia, sekä skaalaedun puutteen että räätälöityjen suunnittelujen kustannusten vuoksi.
Ne ovat kuitenkin paljon tehokkaampia kyseisessä tehtävässä, tuottavat normaalisti tuloksen nopeammin ja paljon vähemmän hukkaavaa laskentatehoa ja energiaa.
ASIC:eja ja muuta AI‑spesifistä laitteistoa käytetään yhä enemmän, kun ala huomaa, että jotkin laskelmat eivät ole ihanteellisia GPU:illa vaan vaativat erikoislaitteita.
Tensor Processing Unitit (TPU:t)
TPU:t kehitettiin Googlen toimesta (GOOGL ) erityisesti tensorilaskelmien (liittyen transformer‑pohjaiseen laskentaan) suorittamiseen. Ne on optimoitu suuritehoiseen, matalan tarkkuuden aritmetiikkaan.

Lähde: C#Corner
Tämä antaa TPU:ille korkean suorituskyvyn, tehokkuuden ja skaalautuvuuden suurten neuroverkkojen kouluttamiseen.
TPU:t omaavat erikoisominaisuuksia, kuten matriisinkertoloyksikkö (MXU) ja oma kytkentätopologia, jotka tekevät niistä ihanteellisia AI‑koulutuksen ja inferenssin nopeuttamiseen.
TPU:t ohjaavat Geminiä ja kaikkia Googlen AI‑pohjaisia sovelluksia, kuten Search, Photos ja Maps, palvellen yli 1 miljardia käyttäjää.
Tämä laitteistotyyppi voi merkittävästi nopeuttaa neuroverkkojen kehittämistä ja toimintaa, jossa satunnaiset virheet ovat vähemmän merkittäviä, koska nämä mallit perustuvat vahvasti tilastoihin ja suuriin laskentamääriin.
Loppukäyttäjien tehtävistä TPU:ille parhaiten soveltuvat syväoppiminen, puheentunnistus ja kuvaluokittelu.
Neuroverkkoprosessorit (NNP:t):
Myös Neural Processing Unit (NPU) -yksiköihin liittyvät ja neuromorfofisia siruja kutsuvat NPP:t ovat erikoistuneet neuroverkkojen laskentaan, suunniteltu jäljittelemään ihmisen aivojen hermoyhteyksiä. Niitä kutsutaan myös joskus AI‑kiihdyttimeksi, vaikka termi on vähemmän määritelty.
NPU integroi myös tallennuksen ja laskennan synaptisten painojen kautta. Näin se voi säätää tai “oppia” ajan myötä, mikä johtaa parempaan toiminnalliseen tehokkuuteen.
An NPU includes specific modules for multiplication and addition, activation functions, 2D data operations, and decompression.
The specialized multiplication and addition module is used to perform operations relevant to the processing of neural network applications, such as calculating matrix multiplication and addition, convolution, dot product, and other functions.
Erikoistuminen voi auttaa NPU:ta suorittamaan operaatio yhden laskelman avulla sen sijaan, että yleiskäyttöinen laitteisto tekisi tuhansia. Esimerkiksi IBM väittää, että NPU voi radikaalisti parantaa AI‑laskennan tehokkuutta verrattuna GPU:ihin.
“Testaukset ovat osoittaneet, että joidenkin NPU:iden suorituskyky on yli 100 kertaa parempi kuin vastaavalla GPU:lla, samalla energian kulutuksella.”
Tämän energiatehokkuuden vuoksi NPU:t ovat suosittuja valmistajien keskuudessa asennettina käyttäjälaitteisiin, joissa ne voivat auttaa suorittamaan paikallisesti generatiivisten AI‑sovellusten tehtäviä, esimerkkinä “edge computing”. (katso alla lisää aiheesta).
Monia menetelmiä tutkitaan parhaillaan neuromorfisten sirujen luomiseksi:
- Hyödyntää alkavaa ferroelectriciteettia, edelleen heikosti ymmärretty ilmiö.
- Aktiivinen alusta, jossa käytetään vanadia tai titaania.
- Käyttämällä memristoreja, uutta tyyppistä elektronista komponenttia, joka voi suorittaa AI‑tehtäviä 1/800‑osalla normaalista energiankulutuksesta.
Apulaisprosessoriyksikkö (XPU:t)
XPU yhdistää CPU:n (prosessorin), GPU:n (grafiikkakortin / rinnakkaisprosessorit) ja muistin samaan elektroniseen laitteeseen.

Lähde: Broadcom
XPU on laaja termi, joka kattaa monia variaatioita tästä konseptista, jossa kaikki laitteisto tuodaan itseensä sisältyviin yksiköihin, mukaan lukien Data Processing Unitit (DPU:t), Infrastructure Processing Unitit (IPU:t), ja Function Accelerator -kortit (FAC:t).
XPU:t nähdään ratkaisevan kasvavan ongelman AI‑datakeskuksissa, eli kasvavan tarpeen yhteyksille alayksiköiden välillä, jolloin dataviiveestä tulee tärkeä tekijä, joka hidastaa laskentaa enemmän kuin saatavilla oleva laskentateho.
Periaatteessa sirut (GPU:t, TPU:t, NPP:t, jne.) odottavat dataa yhtä paljon kuin ne varsinaisesti työskentelevät.
Tämän teknologian johtaja on Broadcom (AVGO ), josta keskustelimme yksityiskohtaisesti omassa sijoitusraportissa.
Field-Programmable Gate Arrayt (FPGA:t):
FPGA:t ovat ohjelmoitavia prosessoreita, mikä tekee niistä merkittävästi joustavampia ja uudelleenkonfiguroitavampia kuin jäykemmät ASIC:t. FPGA:ita voidaan räätälöidä tiettyihin AI‑algoritmeihin, tarjoten mahdollisesti paremman suorituskyvyn ja energiatehokkuuden.

Lähde: Microcontrollers Labs
Joustavuus tuo mukanaan kustannuksia, sillä FPGA:t ovat yleensä monimutkaisempia, kalliimpia ja kuluttavat enemmän sähköä. Ne voivat kuitenkin silti olla tehokkaampia kuin yleiskäyttöinen laitteisto.
Tämä tekee niistä eräänlaisen niche‑tuotteen, jossa niiden joustavuus kompensoi haittoja. Esimerkiksi koneoppiminen, konenäkö ja luonnollisen kielen prosessointi voivat hyötyä FPGA:iden monipuolisuudesta.
Korkeakaistamainen muisti (HBM):
Tärkeimmät kehitykset räätälöidyssä AI‑keskeisessä laitteistossa ovat olleet laskentatehon alalla, pitkään ne ovat olleet pullonkaula enemmän laskentakapasiteetin rakentamisessa uusien AI:iden kouluttamiseksi.
Silti nämä järjestelmät tarvitsevat myös korkean tehokkuuden tukijärjestelmiä, joista muisti on tärkeä. HBM tarjoaa, kuten nimensä kertoo, suuremman kaistanleveyden kuin perinteinen DRAM.
Se saavutetaan pinnoittamalla useita DRAM‑dieja pystysuunnassa ja yhdistämällä ne läpi‑silikoni‑viia (TSV)‑yhteyksillä. HBM:n ensimmäinen sukupolvi kehitettiin vuonna 2013.
Pystypinnoitus säästää tilaa ja vähentää fyysistä etäisyyttä, jonka dataa täytyy kulkea, nopeuttaen datansiirtoa, mikä on välttämätöntä AI‑laskennassa.
HBM:t ovat monimutkaisempia valmistaa ja kalliimpia kuin DRAM, mutta suorituskyky‑ ja energiatehokkuusetuja usein oikeuttaa korkeamman kustannuksen AI‑sovelluksissa.
AI-datakeskuksen infrastruktuuri: virta, jäähdytys & yhteydet
Muistin ja laskentatehon lisäksi AI‑datakeskusten apujärjestelmät ovat myös tärkeitä. Ilman niitä data ei voi kiertää tarpeeksi nopeasti, sirut ylikuormittuisivat tai saatavilla oleva virta olisi riittämätöntä.
Tämä tarkoittaa, että esimerkiksi Broadcomin yhteyslaitteisto hyötyy merkittävästi AI‑datakeskusten kasvusta, samoin kuin erikoistuneet ratkaisut, kuten jäähdytyslaitteiden toimittajat, esimerkiksi Vertiv (VRT ) tai Schneider Electric (SU.PA).
Virransyöttö saattaa myös muodostua ongelmaksi, ja useat teknologiayritykset pyrkivät ratkaisemaan sen panostamalla ydinenergiaan, ensimmäisenä Microsoft vuonna 2024, jonka jälkeen monet muut ovat seuranneet.
Yhdistettynä teknologia‑alan sitoutumiseen AI:n hiilijalanjäljen vähentämiseen, tämän tulisi hyödyttää suuresti ydin‑ tai uusiutuvan energian yrityksiä, kuten Cameco (CCJ ), GE Vernova (GEV ), First Solar (FSLR ), NextEra (NEE ) tai Brookfield Energy Partners (BEP ) (seuraa linkkejä saadaksesi raportin kustakin yrityksestä).
Nousevat AI‑laskentateknologiat
Kvanttilaskenta
Koska AI on niin nälkäinen laskentatehoa kohtaan, on mahdollista, että alan tulevaisuuden laitteisto ei ole edes nykyisten piisirujen ratkaisuissa.
Yksi mahdollisuus on, että kvanttilaskentaa voitaisiin käyttää havaitsemaan kuvioita paljon tehokkaammin kuin klassinen laskenta koskaan pystyy, mikä on jo tutkijoiden tutkimassa.
Kvanttilaskentaa kokonaisuudessaan voitaisiin käyttää ratkaisemaan joitakin erityisiä laskelmia, jotka ovat lähes mahdottomia binaarilaskennalla. Tämä todennäköisesti sovelletaan AI:hin, mutta ensimmäiset kaupalliset kvanttitietokoneet ovat vielä muutaman vuoden päässä, ja suuri kvanttiverkko vielä kauempana.
Fotoniikka
Käyttämällä valoa elektronien sijaan datan kuljettamiseen, fotoniikka voisi olla paljon nopeampaa kuin elektroniset laitteet.
Koska kvanttitietokoneet yleensä kuljettavat kvanttitietoa lomittuneilla fotoneilla, on paljon päällekkäisyyttä kvanttilaskennan ja fotoniikan välillä, ja ensimmäinen kaksinkertainen kvantti‑fotoni‑siru on jo ilmoitettu.
Organoidit
Koska suurin osa AI:sta jäljittelee tietokoneissa aivojen neuroverkkojen toimintaa, jotkut tutkijat pohtivat, voisimmeko sen sijaan käyttää … todellisia aivosoluja.
Tämä on kiehtova ajatus, erityisesti kun jotkut tutkimukset voivat viitata siihen, että aivot ovat itse asiassa orgaaninen kvanttitietokone.
Tätä tyyppistä “tietokonetta” kutsutaan organoideiksi, ja se koostuu periaatteessa laboratoriossa tietokipasirulle kasvatetuista neuroneista. Neuronit järjestäytyvät itse dendriitteihinsä ja yhteyksiinsä sirun stimulaation seurauksena.
Tämä teknologia on vielä uusi ja perustuu bio‑3D‑tulostukseen.
Muut
Tutkimme muita vaihtoehtoja piirilaskennalle artikkelissa “Top 10 Non‑Silicon Computing Companies”, kuten vanadiumidioksidi, grafeeni, redoksigating tai orgaaniset materiaalit.
Jokainen lupaa olla joko paljon nopeampi tai paljon vähemmän energiaintensiivinen kuin perinteinen piiripohjainen laskenta. Ne ovat kuitenkin edelleen melko uusia eikä niiden odoteta mullistavan AI‑alaa kaupallisessa mittakaavassa, ainakaan seuraavan 5–10 vuoden aikana.
Pilvi‑AI ja Edge‑AI: Saavutettavuustrendit
Pilvi‑AI
Koska voimakkaimmat AI‑järjestelmät valmistavat suuret teknologiayritykset, ne ovat enimmäkseen saatavilla pilven kautta. Sama pätee myös AI‑spesifiseen laitteistoon.
Tämän trendin johtaja on Coreweave (CRCW ), yritys, joka siirtyi pilvipalveluntarjoajasta kryptovaluutan louhintaan GPU:ita käyttäen, ja nykyään tarjoaa tilauspohjaista AI‑laskentaa.
Tämä teki CoreWeave:sta keskeisen kumppanin nouseville AI‑startupeille, jotka yrittävät kilpailla teknologiayritysten kanssa, kuten Inflection AI and its $1.3B GPU cluster, rahoitettu uudella rahoituskierroksella.
“Kaksi kuukautta sitten yritys ei ehkä ollut olemassa, ja nyt sillä voi olla $500 miljoonaa riskipääomaa.
Ja tärkein asia heidän on varmistaa pääsy laskentaan; he eivät voi lanseerata tuotettaan tai liiketoimintaansa ennen kuin heillä on se,”
Kun puhdas AI‑laitteistojen toimija alkaa varoa suurten teknologiayritysten omien GPU:iden, TPU:iden, XPU:iden jne. tuotantoa ja niiden siirtymistä asiakkaista kilpailijoiksi, on todennäköistä, että yritykset kuten CoreWeave saavat etuoikeutetun pääsyn Nvidian ja muiden uusimpiin laitteistojulkaisuihin.
Tämä liiketoimintamalli tulee todennäköisesti olemaan erityisen tärkeä AI‑koulutukselle, joka vaatii paljon enemmän laskentakapasiteettia kuin pelkkä valmiiden AI:iden käyttö.
Edge‑laskenta & AI‑PC:t
Toinen nopeasti kehittyvä AI‑laskennan tapaus on tarve suorittaa AI‑järjestelmien laskenta paikan päällä, mahdollisimman lähellä todellisia tilanteita.
Tämä on välttämätöntä järjestelmille, jotka eivät kestä AI:n irrottamista yhteydestä, jos yhteys katkeaa, tai kun viive pilven kanssa on liian hidas.
Hyvä esimerkki on itseohjautuvat autot, joiden odotetaan ymmärtävän ympäristönsä offline‑tilassa.
Tätä laskentatyyppiä kutsutaan edge‑laskennaksi, ja se hyötyy suuresti tehokkaammasta ja vähemmän virtaa kuluttavasta laitteistosta.
Se voi lisätä AI:n luotettavuutta, ja kun mallit tulevat tehokkaammiksi, kuten DeepSeekin suuri harppaus osoittaa, siitä voi tulla yleisempi AI‑julkaisumalli tulevaisuudessa.
Sama syy, AI‑PC:t kuten äskettäin Nvidian lanseeraama, saattavat pitkällä aikavälillä riittää monien AI‑sovellusten paikalliseen suorittamiseen, lisäten yksityisyyttä ja turvallisuutta verrattuna jatkuvasti pilveen yhteydessä oleviin AI:hin.
Päätelmä
AI‑laitteisto on pitkään ollut melko synonyymi GPU:ille, sillä grafiikkakortit olivat paljon tehokkaampia AI‑koulutuksessa kuin muut laitteistotyypit, kuten CPU:t. Tämä loi Nvidian ja monien sen varhaisten osakkeenomistajien vaurautta.
GPU:t, erityisesti AI‑keskeiset “super GPU:t”, tulevat todennäköisesti pysymään tärkeinä AI‑datakeskusten rakentamisessa. Mutta ne kehittyvät vain yhdeksi komponentiksi yhä monimutkaisemmissa ja erikoistuneemmissa järjestelmissä.
Transformer‑operaatiot siirretään TPU:ille, neuroverkot NPP:ille, toistuvat tehtävät omistettuihin ASIC:eihin tai uudelleenkonfiguroituihin FPGA:ihin.
Sillä välin korkea‑kaistamainen muisti, kehittyneet telekommunikaatioliittimet ja erittäin tehokas jäähdytys pitävät kaikki laskentaytimen ympärillä olevat aputoiminnot käynnissä.
Edge‑laskennassa ja pienemmissä AI:ssa kuin massiiviset LLM:t, paikallinen laskenta, mahdollisesti all‑in‑one XPU:illa, todennäköisesti käyttöön tutkijoiden, itseohjautuvien autojen ja yksityisyyttä tai sensuuria huolestuneiden käyttäjien toimesta, mahdollisesti avoimen lähdekoodin AI‑malleilla.
Varmasti on, että AI‑laitteiston “pickien ja lapioiden” myynnistä saadut voitot AI‑kultakannassa eivät ole vielä loppuneet.
Nvidian hallitsevan kauden jälkeen sijoittajat saattavat haluta hajauttaa riskejä levittämällä AI‑laitteistonsa salkkua muihin malleihin, ja ehkä jopa sähköyhtiöihin, jotka tarjoavat arvokkaita gigawatteja maailman yhä suurempien ja lukuisampien AI‑datakeskusten pyörittämiseen.













