Artificiell intelligens

Framväxande teknologier som formar framtiden för AI‑hårdvara

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.

En ny typ av beräkning

Under de senaste åren av exponentiell utveckling inom AI‑teknik har de stora vinnarna varit byggarna av AI‑hårdvara. Detta beror på att modern AI, som mest använder neurala nätverk, använder beräkningskraft på ett mycket annorlunda sätt än klassiska datorer.

Istället för att utföra komplexa beräkningar med en kraftfull CPU, utför de i stället tusentals eller miljontals enklare beräkningar parallellt.

(Du kan läsa mer om hur neurala nätverk uppfanns och fungerar i “Investering i Nobelpristagarnas prestationer – Artificiella neurala nätverk, grunden för AI”)

Hittills har grafikkort, eller GPU:er (Graphics processing units), varit det föredragna verktyget för att utveckla AI, vilket dramatiskt ökat intäkterna och vinsterna för ledarna i sektorn som Nvidia (NVDA ).

Marknaden för AI‑hårdvara förväntas fortsätta växa exceptionellt snabbt, med 31,2 % CAGR från 2025 till 2035.

Denna period bör också se framväxten av många nya typer av AI‑hårdvara, eftersom de GPU:er som omvandlats för AI‑beräkning gradvis ersätts av chip som är specifikt designade för detta ändamål.

På lång sikt är det sannolikt att mer exotiska former av beräkning kommer in på AI‑hårdvarumarknaden, från applikationsspecifika designer till icke‑silikonchip eller till och med att använda faktiska biologiska neuroner.

Hur AI‑tänkande fungerar

Den grundläggande skillnaden mellan klassiska superdatorer och AI är hur data bearbetas. Istället för att lösa komplexa beräkningar skapar neurala nätverk virtuella noder som är kopplade i ett nätverk. Medan det ursprungliga neurala nätverket knappt innehöll några dussin noder och gjorde några hundra anslutningar, använder moderna neurala nätverk som de som används av ChatGPT biljoner möjliga anslutningar, vilket når komplexitetsnivåer som liknar den mänskliga hjärnan.

 

Källa: Nobel Prize

Denna annorlunda beräkningsmetod kräver hårdvara som kan utföra miljontals operationer parallellt, även om den beräkningskraft som avsätts för varje är relativt liten.

Lyckligtvis är detta en typ av hårdvara som redan har varit i drift i många år, såsom grafisk rendering med GPU:er, främst för 3D‑simulering och videospel, och som också använder denna typ av många små beräkningar parallellt.

Det är därför den initiala (och nuvarande) vinnaren i loppet om att säkra tillräckligt med AI‑chip har varit Nvidia, ledaren på GPU‑marknaden.

Alltid snabbare GPU:er

Med uppfinningen av mer effektiva algoritmer och den snabba utvecklingen inom artificiell intelligens som de skapade, exploderade de potentiella tillämpningarna av AI under 2020‑talet.

Det ledde till ett ständigt ökande lopp om att säkra tillräcklig hårdvara, särskilt Nvidia GPU år 2023.

Parallellt kräver de ökande förväntningarna på AI:s potentiella tillämpningar allt smartare AI, vilket i sin tur kräver mer beräkningskraft. Och medan säkrandet av fler GPU:er var en lösning, behövdes även bättre GPU:er.

Branschen levererade, med en 1 000‑faldig prestandaökning på mindre än 8 år.

Källa: NVIDIA

Kan det hålla?

Det finns tecken på att utvecklingen av GPU‑prestanda snart kan avta. För det första är alla de ”lätta” förbättringarna, som att göra GPU:er större och med mindre och tätare transistorer, redan utnyttjade till max. Så vidare förbättring måste komma från mer radikala omdesigns och innovationer.

Sekundära problem smyger sig också in i branschen. Till exempel producerar mycket tätare och kraftfullare GPU:er mycket spillvärme, till den grad att fler av samma bara skulle smälta chippen.

Denna spillvärme indikerar också mycket bortkastad energi. Att säkra en tillräcklig tillgång på stabil baslastkraft blir ett problem för AI‑företag, där alla stora teknikföretag skyndar sig att säkra leveranser från kärnkraftverk.

Slutligen blir AI‑beräkning mer specialiserad, med olika metoder som dyker upp hos olika företag och för olika tillämpningar, var och en med olika krav på hårdvaran. Så sannolikt är epoken av allmänna GPU:er som används av alla AI‑företag på väg att ta slut, även om det sker långsamt.

Super‑GPU‑eran

Fram till nu har de flesta AI‑datacenter bestått av att koppla ihop tusentals GPU:er i dedikerade servrar.

Den omedelbara lösningen på det växande överhettnings‑ och energiförbrukningsproblemet blir att bygga integrerad hårdvara som går bortom enbart samlade enskilda GPU:er.

“I dagens datacenter kan du inte placera samma antal NVIDIA H100‑servrar eller GB200 Superchip‑beräkningsbrickor i ett skåp som du kunde med tidigare GPU‑generationer på grund av de högre kraft‑ och kylkraven.”

Ett stort steg i den riktningen är den senaste lanseringen från Nvidia av GB200 NVL72. Denna hårdvara är designad för att fungera som en enda massiv GPU, vilket gör den mycket kraftfullare än även den tidigare rekordbrytande H100‑modellen.

Den förbättrade termiska effektiviteten och energibesparingarna gör att vi kan vara mer generösa med hur många GPU:er vi kan placera i ett rack – vilket betyder fler GPU:er för våra kunder.

Detta bör också vara mycket mer energieffektivt, en avgörande punkt eftersom AI‑industrin kan få brist på energi innan den får brist på chip på den hastighet som AI‑datacenter byggs. Och mer beräknings‑ och energieffektivitet betyder mindre spillvärme, vilket tillfälligt löser överhettningsproblemet också.

Källa: Nvidia

För närvarande har CoreWeave blivit den första molnleverantören med generellt tillgängliga Nvidia GB200 NLV72‑instanser.

(Du kan läsa mer om CoreWeave och deras tillhandahållande av AI‑molnberäkning till företag som utvecklar AI‑lösningar i “CoreWeave: Moln‑AI‑hyperskaler”).

Icke‑GPU AI‑hårdvara

Fältprogrammerbara grindmatriser (FPGAs)

En annan typ av hårdvara som används för AI‑utveckling är fältprogrammerbara grindmatriser. FPGA är integrerade kretsar som kan omprogrammeras för att utföra specifika uppgifter mer effektivt. De fungerar genom att ha konfigurerbara förbindelser mellan sina komponenter.

Detta kan göra FPGA:er mer flexibla än GPU:er och ge större potential för optimering vid specifika typer av beräkningar.

FPGA:er är också mer energieffektiva än GPU:er. Deras låga latens (snabb reaktionstid) gör dem dessutom mycket effektiva för verkliga tillämpningar som kräver snabba reaktioner.

Dock är FPGA:er också mindre kapabla att hantera mycket krävande beräkningar som kräver mycket kraft.

En annan fråga är att även om FPGA:er är omprogrammerbara kan detta vara en tids‑ och arbetsintensiv process. Så de kan vara mycket långsammare att designa, bygga och programmera. Detta kan vara ett allvarligt problem i ett område som gör revolutionerande framsteg var sjätte månad.

Detta innebär att hittills har FPGA:s användningsområden koncentrerats på vissa AI‑tillämpningar, medan den allmänna utvecklingen fortfarande förlitar sig på mindre effektiva, men allmänna GPU:er:

  • Real‑tidsbehandling: När inkommande data måste behandlas snabbt, som för digital signalbehandling, radarsystem, autonoma fordon och telekommunikation.
  • Anpassad hårdaccelerering: Konfigurerbara FPGA:er kan finjusteras för att accelerera specifika djupinlärningsuppgifter och HPC‑kluster genom att optimera för specifika datatyper eller algoritmer.
  • Så moderna AI‑datacenter kan successivt bli en blandning av GPU:er och FPGA:er, där varje hårdvara är dedikerad till de deluppgifter den kan utföra bäst.
    • Edge‑computing: Detta innebär att flytta beräknings‑ och lagringskapacitet närmare slutanvändaren, exempelvis direkt i en bil eller en drönare. I dessa fall är FPGA:ens låga energiförbrukning och kompakta storlek fördelar.

Applikationsspecifika integrerade kretsar (ASICs)

ASIC‑system är byggda för specifika beräkningstyper och kan endast utföra dessa. Så det är mer en ren integrerad krets än ett datorkort; FPGA:er kallas ibland även programmerbara ASIC:er.

Anledningen till att använda ASIC:er istället för FPGA:er eller GPU:er är att ASIC:er är mycket snabbare än någon annan logikenhet. De är också mer energieffektiva och mindre i storlek.

Det är därför ASIC‑miners exempelvis används i kryptovalutamining, med en design optimerad för att utföra den specifika typ av beräkning som krävs.

Källa: Wevolver

Dock är ASIC:er också mycket mer komplexa att designa, så det är bara meningsfullt att utveckla en för en uppgift som kommer att upprepas tillräckligt ofta för att täcka designkostnaderna. Sammantaget är ASIC:er ekonomiskt meningsfulla endast när de övervägs för massproduktion.

Anpassade designer kräver också expertkunskap, och vanligt använda programmeringsspråk och bibliotek kan potentiellt vara oanvändbara.

Detta behov av anpassad design kan dock också vara en fördel, eftersom det skapar ytterligare skydd för immateriella rättigheter (IP).

Användningsområdena för ASIC:er liknar FPGA:er: edge‑computing, bildigenkänning, telekommunikation och signalbehandling, men ännu mer än FPGA:er kräver de ofta upprepade beräkningar.

Eftersom de inte är flexibla är det också osannolikt att de ensamma räcker för komplexa AI‑uppgifter. De kan dock integreras i ett AI‑hårdvarusystem för att ge det mer effektivitet och hastighet.

Speciellt företag som Etched utvecklar ASIC:er specifikt designade för att utföra transformer‑beräkningar (det ”T” i chatGPT).

Källa: Etched

Neuromorfa chip

Utöver att bara förbättra GPU:er eller bygga mer effektiva ASIC:er, tittar andra koncept på att helt förändra hur beräkning utförs.

En idé är att om vi designar ett neuralt nätverk bör vi ha en chiparkitektur som speglar det.

Detta är idén med neuromorfa chip, som fungerar som sammankopplade neuroner på hårdvarunivå istället för att simulera dem genom komplexa matematiska ekvationer och miljontals parallella beräkningar.

Dessa enheter kallas ibland NPUs (Neural Processing Unit), vanligtvis genom att kombinera många olika komponenttyper i en enhet.

Neuromorfa chip använder ofta komplexa elektriska signaler, närmare analog data. Detta skiljer sig från ”normala” datorer som använder en Von Neumann‑design med binära signaler (0 och 1).

Källa: Tech Target

Många metoder utforskas för närvarande för hur man skapar neuromorfa chip:

Fotonikchip

Ett annat alternativ för att kringgå många av de nuvarande begränsningarna i silikongränsnitt är att byta till fotonikdatorer. Istället för att elektroner bär informationen, är det fotoner från lasrar som gör det.

Denna metod har fördelen att vara mycket mindre känslig för överhettning och att ljus är den snabbaste rörliga saken i universum.

För närvarande har hållbarheten hos fotonikkomponenter, särskilt minne, varit ett problem, men detta förändras snabbt.

Andra senaste framsteg inom fotonik inkluderar:

Använda faktiska neuroner

Ett annat sätt att ytterligare driva AI att nå liknande prestanda som den faktiska hjärnan är kanske helt enkelt att använda riktiga hjärnor från början.

När allt kommer omkring, om ett neuralt nätverk gjort av faktiska neuroner kan vara mycket anpassningsbart och utmärkt i mönsterigenkänning i naturen, varför skulle det inte fungera i en mer artificiell kontext?

I mars 2025 gick detta koncept längre med lanseringen av Cortical Labs av CL1, den första syntetiska biologiska intelligensen (SBI).

Riktiga neuroner odlas i en näringsrik lösning som förser dem med allt de behöver för att vara friska. De växer över ett kiselchip, som sänder och tar emot elektriska impulser i den neurala strukturen.

Det suddar verkligen ut gränsen mellan artificiell och naturlig intelligens. Är en dator gjord av faktiska neuroner fortfarande artificiell?

Vi integrerar neuronerna i biOS med en blandning av hårt kisel och mjuk vävnad. Du kan ansluta direkt till dessa neuroner. Distribuera kod direkt till de riktiga neuronerna och lösa dagens svåraste utmaningar.

Neuronen är självprogrammerande, oändligt flexibel och resultatet av fyra miljarder år av evolution. Vad digitala AI‑modeller spenderar enorma resurser på att efterlikna, börjar vi med.

Detta kan vara ett verkligt genombrott om vissa teorier som betraktar den mänskliga hjärnan mer som en kvantdator än ett elektriskt system visar sig vara sanna.

Även om det fortfarande är en mycket framväxande teknik, kan den få ett lyft med de framsteg som gjorts inom närliggande områden, som 3D‑utskrift av mänskliga organ, inklusive funktionellt hjärnvävnad, samt produktion av organoider (mini‑hjärnor) av företag som Final Spark och BiologIC.

Hjärn‑dator‑gränssnitt

Ett annat sätt att stärka AI‑hårdvara kan vara att använda den i direkt gränssnitt med en annan typ av biologisk superdator: hjärnan som redan finns i vårt skalle och utför vårt tänkande.

Inledningsvis kommer Brain‑Computer Interfaces (BCI) sannolikt att mest användas för att hjälpa personer som lider av neurologiska tillstånd.

Nya metoder för att göra implantaten mer hållbara och mindre invasiva bör också hjälpa.

På lång sikt kan även detta sudda ut gränsen mellan maskin och mänsklig intelligens. Om du tänker på något med hjälp av en AI i direkt interaktion med oss genom BCI, vem gjorde egentligen tänkandet?

Dock, på grund av etiska och säkerhetsmässiga bekymmer, är detta sannolikt en av de mest avlägsna teknologierna, trots förväntningarna från science‑fiction‑verk som Altered Carbon, Neuromancer, eller Cyberpunk 2077.

(Vi täckte de mest framstående företagen inom området i “5 bästa Brain‑Computer Interface‑företagen (BCI)”).

Hur mycket beräkning behövs egentligen?

DeepSeek

I många år har varje AI‑företag tävlat om att lägga till så mycket beräkning som möjligt så snabbt som möjligt, i tron att mer alltid är bättre.

Detta har utmanats av den brutala ankomsten av det kinesiska AI‑företaget DeepSeek. Med en modell som är 10‑100 × mer effektiv än sina konkurrenter och kostar endast 3 %‑5 % för motsvarande eller överlägsen prestanda, har DeepSeek utmanat kravet på mer beräkningskraft för att bygga bättre AI‑system.

En stor anledning till att DeepSeek fokuserade så mycket på modellens effektivitet var den begränsade tillgången för kinesiska AI‑företag till AI‑chip. Detta blev tydligt när det kort efter lanseringen visade att AI‑modeller från andra kinesiska företag presterade lika imponerande: Alibabas Qwen, Moonshot AI:s Kimi, ByteDances Doubao eller Baidus Ernie Bot.

Som ordspråket säger: ”Nöden är uppfinningens moder”.

Det är sannolikt att de kommande åren kommer en dubbel fokus på bättre prestanda och högre effektivitet att dominera AI‑industrin.

Det betyder dock inte att mer beräkning inte kommer att ge bättre resultat. Enkelt uttryckt är detta inte den enda vägen till framgång i AI‑industrin, och mycket välfinansierade företag som OpenAI kan ha varit något slappa med sina utgifter.

För närvarande har de flesta AI‑system varit pågående arbete och experimentella designer med endast begränsade tillämpningar. Ju mer de integreras i arbetsflödet för miljontals företag världen över, desto mer AI‑beräkning kommer att behövas.

Och ju mer beräkning som behövs, desto större blir efterfrågan på mer effektiv och mindre energikrävande hårdvara.

Så precis som för traditionell beräkning kan vi anta att marknaden fortfarande kommer att kräva ständigt förbättrade chip, särskilt eftersom AI snart kan bli en av världens största energikonsumenter.

EdgeAI & AI‑PC

En annan effekt av framväxten av DeepSeek och andra kinesiska AI‑modeller med lägre beräkningskrav är att AI‑modeller, särskilt ”destillerade” modeller, nu kan köras på högpresterande enskilda maskiner, istället för gigawatt‑stora gigantiska AI‑datacenter.

Det bekräftar förespråkarna för EdgeAI, som argumenterar för att en stor del av AI‑beräkningarna måste utföras ”på plats”, istället för endast i molnet.

Eftersom DeepSeek är en öppen källkodsmodell öppnar detta också vägen för många individuella experiment med AI‑datorer: tillräckligt kraftfulla för att köra AI‑modeller, men billiga och små nog att köpas av enskilda personer. Sammantaget leder detta inte så mycket till minskad efterfrågan på AI‑beräkning, utan kanske en mer decentraliserad process för att utveckla och använda AI‑tillämpningar.

Så AI‑PC:n är sannolikt den nya stora trenden inom PC‑byggande, med den specialiserade pressen som redan diskuterar frågan i detalj och vilket märke som är bäst särskilt eftersom AI gör sitt intåg i de flesta teknikföretag, inklusive Microsoft (MSFT ), där Copilot blir nästan allestädes närvarande i Windows‑OS och annan mjukvara från företaget.

Slutsats

Från spel‑GPU:er utvecklas hårdvaran för AI snabbt. Det började med GPU:er designade för AI och utvecklas nu med ”super‑GPU:er” som är designade från grunden för att passa in i AI‑datacenter med lägre energiförbrukning och värmeproduktion.

Nästa steg blir sannolikt en vidare integration av generella GPU:er med ASIC‑ och FPGA‑chip för att utföra specifika AI‑uppgifter med mindre kraft‑ och utrymmesbehov.

Längre fram i tiden är satsningarna på vilken teknik som blir vinnaren för AI‑beräkning: neuromorfa chip, fotonik, spintronik eller till och med faktiska biologiska neuroner tränade att interagera med kisel‑substrat, och kanske AI som interagerar direkt med våra egna hjärnor genom direkta gränssnitt.

För alla dessa teknologier är det säkert att den explosiva tillväxten i AI:s kapacitet och den medföljande explosionen i tillämpningar kommer att hålla efterfrågan på mer och bättre AI‑hårdvara i ständig ökning.

Så även om mer effektiva AI‑modeller kommer på marknaden, som DeepSeek, kan den plötsliga efterfrågeökningen på AI‑PC:n vara en god indikator på att AI‑hårdvara sannolikt kommer att förbli något bristfällig i förhållande till efterfrågan under de kommande åren.

En ledare inom AI‑hårdvara

Nvidia

(NVDA )

NVIDIA har utvecklats från ett nischat halvledarföretag som specialiserade sig på grafikkort till en teknikjätte i framkanten av AI‑revolutionen och den enorma mängden hårdvara som den kräver.

Detta uppnåddes genom utvecklingen av CUDA, ett generellt programmeringsgränssnitt för NVIDIAs GPU:er, vilket öppnade dörren för användningar utöver spel.

“Forskare insåg att genom att köpa detta spelkort som heter GeForce, lägger du till det i din dator och får i princip en personlig superdator. Molekylär dynamik, seismisk bearbetning, CT‑rekonstruktion, bildbehandling – en hel rad olika saker.”Jensen Huang, i en intervju med Sequoia

Denna bredare adoption av GPU:er, och mer specifikt NVIDIAs hårdvara, skapade en positiv återkopplingsloop baserad på nätverkseffekter: ju fler användningar, desto fler slutanvändare och programmerare som är bekanta med den, desto fler försäljningar, desto större FoU‑budget, desto snabbare acceleration i beräkningshastighet, fler användningar osv.

Källa: Nvidia

Idag omfattar den installerade basen hundratals miljoner CUDA‑GPU:er.

En annan anmärkningsvärd sak med utvecklingen av AI‑beräkningskraft är att den följer en exponentiell lag istället för den mer linjära Moores lag för CPU. Detta beror på att inte bara GPU‑hårdvaran blir bättre, utan den nödvändiga bearbetningskraften har minskat tack vare radikala förbättringar i hur neurala nätverk tränas.

Medan den är ledande inom GPU och AI, NVIDIA är också mycket aktivt i att utveckla kvantdatorer till en ny tillväxtmotor.

På samma sätt som de lanserade CUDA för neurala nätverksapplikationer har Nvidia släppt CUDA‑Q för kvantdatorer, vilket erbjuder ett kvantmolnsystem där du kan hyra NVIDIAs kvantdatorkapacitet via en molntjänst.

Källa: NVIDIA

Detta inkluderar också teknik som NVIDIAs cuQuantum för forskare att emulera kvantdatorer, cuPQC för kvantkryptering och DGX Quantum för integration av både klassisk och kvantberäkning.

Sammanfattningsvis är NVIDIA i framkant när det gäller att bygga ett ekosystem för kvantdatorer, och utnyttjar sin position som ledare inom AI och AI‑hårdvara.

Källa: NVidia

Med en stark position inom AI, kryptomining och möjligen snart kvantdatorer är Nvidia mycket väl positionerat för att bli ett av de dominerande företagen inom beräkningshårdvara under det kommande decenniet.

Du kan läsa mer om Nvidias historia, affärsmodell och innovationer i “NVIDIA (NVDA) Spotlight: Från grafikjätte till AI‑titan“.

Senaste om NVIDIA

Jonathan är en före detta biokemist som arbetade med genetisk analys och kliniska prövningar. Han är nu en aktieanalytiker och finansskribent med fokus på innovation, marknads cykler och geopolitik i sin publikation The Eurasian Century.