Intelligenza artificiale

L’IA incontra l’efficienza: un nuovo chip riduce del 50% il consumo energetico dei LLM

Pubblicato il 14 maggio 2025

Aggiornato il 29 maggio 2026

Gaurav Roy

Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.

L’attuale boom dell’intelligenza artificiale (IA) sta portando a un aumento dei data centre, il che sta generando una enorme domanda di energia per far funzionare e raffreddare i server al loro interno.

Sebbene ci siano oltre 8.000 data centre in tutto il mondo, la maggior parte dei quali negli Stati Uniti, questo numero aumenterà notevolmente nei prossimi anni.

Secondo le stime del Boston Consulting Group, la domanda di data centre crescerà del 15%‑20% ogni anno fino al 2030. A quel punto, la società prevede che rappresenteranno il 16% del consumo totale di energia negli Stati Uniti, rispetto al solo 2,5% prima del rilascio di ChatGPT di OpenAI nel 2022.

Nel frattempo, il rapporto speciale su Energia e IA dell’International Energy Agency (IEA) pubblicato quest’anno prevede che la domanda di elettricità dei data centre a livello globale almeno raddoppierà entro la fine di questo decennio, arrivando a circa 945 TWh. Questo è quasi equivalente al consumo attuale del Giappone.

L’organizzazione intergovernativa autonoma con sede a Parigi segnala che l’IA è il principale motore di questo aumento, con la domanda di elettricità dei data centre ottimizzati per l’IA prevista in crescita di oltre quattro volte entro il 2030.

Negli Stati Uniti, in particolare, il consumo energetico dei data centre è già destinato a rappresentare circa la metà della crescita della domanda di elettricità tra ora e il 2030. Spinto dall’uso dell’IA, l’economia statunitense, secondo il rapporto, consumerà più energia per elaborare dati a quel punto rispetto a quella necessaria per produrre tutti i beni ad alta intensità energetica messi insieme.

Questa fame insaziabile di energia rappresenta un enorme problema per l’avanzamento e l’adozione dell’IA. Tuttavia, il lato positivo è il numero crescente di ricercatori e aziende che lavorano per ridurre il consumo energetico dell’IA e renderla più efficiente.

Ciò che è interessante di questi sforzi è che molti di essi utilizzano l’IA per affrontare le proprie sfide energetiche.

Proprio questo mese, un team di ricercatori ha dimostrato un nuovo chip che utilizza l’IA per ridurre dell’50% l’impronta energetica dei grandi modelli linguistici (LLM), segnando un importante sviluppo per rendere i LLM più convenienti e sostenibili da eseguire.

Nuovo chip sfrutta l’IA per ridurre il consumo energetico dei LLM

New Chip Leverages AI

Ricercatori della College of Engineering dell’Oregon State University hanno sviluppato il nuovo chip IA efficiente per risolvere il problema del consumo massiccio di elettricità delle applicazioni IA basate su LLM come GPT‑4 di OpenAI e Gemini di Google.

Un tipo di modello di apprendimento automatico (ML), un grande modello linguistico (LLM) è pre‑addestrato su enormi quantità di dati per eseguire compiti di elaborazione del linguaggio naturale (NLP) come generazione di testo, sintesi, semplificazione, ragionamento testuale, traduzione linguistica e altro.

I chatbot più popolari e ampiamente usati oggi includono GPT‑4o, o3 e o1 di OpenAI, Gemini e Gemma di Google, Llama di Meta, R1 e V3 di DeepSeek, Claude di Anthropic, Nova di Amazon, Phi di Microsoft e Grok di xAI.

Negli ultimi anni, i LLM hanno trasformato completamente il campo dell’IA consentendo alle macchine di comprendere e generare testo simile a quello umano con maggiore precisione. Tuttavia, questa evoluzione dei LLM ha comportato un aumento esponenziale delle loro dimensioni.

La dimensione di un LLM, misurata dal numero di parametri, è il principale fattore che determina il suo consumo energetico. Ciò significa che più grande è il modello, maggiore è il fabbisogno di potenza computazionale per l’addestramento e l’inferenza.

Ad esempio, ChatGPT‑1 aveva poco meno di 120 milioni di parametri, che sono saliti a 175 miliardi con GPT‑3, e poi a circa 1,8 trilioni di parametri con GPT‑4.

Questo enorme aumento delle dimensioni e delle capacità dei LLM significa che anche il loro consumo energetico sta crescendo a una scala senza precedenti. Oltre alle dimensioni del modello, fattori come il tipo di hardware utilizzato per addestrare questi LLM, la durata del processo di addestramento, l’infrastruttura (cioè i data centre), l’elaborazione dei dati, l’ottimizzazione del modello e l’efficienza degli algoritmi influenzano il consumo energetico dei LLM.

Ecco il nuovo chip dei ricercatori dell’OSU. Secondo Tejasvi Anand, professore associato di ingegneria elettrica all’OSU che dirige anche il Mixed Signal Circuits and Systems Lab presso l’Università:

“Il problema è che l’energia necessaria per trasmettere un singolo bit non si sta riducendo allo stesso ritmo con cui aumenta la domanda di velocità dei dati. È questo che fa sì che i data centre consumino così tanta energia.”

Per superare questo problema, il team ha progettato e sviluppato un nuovo chip che consuma solo la metà dell’energia rispetto ai design convenzionali.

Anand e lo studente di dottorato Ramin Javad hanno presentato questa nuova tecnologia alla Conferenza IEEE Custom Integrated Circuits (CIC), tenutasi a Boston lo scorso mese. La conferenza, che ospita forum, panel, esposizioni e presentazioni orali, è dedicata allo sviluppo dei circuiti integrati (IC), che costituiscono il blocco fondamentale dei sistemi elettronici moderni fornendo funzionalità e potenza di elaborazione in un pacchetto compatto ed efficiente.

La tecnologia più recente è stata realizzata con il supporto del Center for Ubiquitous Connectivity (CUbiC), della Semiconductor Research Corporation (SRC) e della Defense Advanced Research Projects Agency (DARPA). Inoltre, Javadi ha ricevuto il Best Student Paper Award alla conferenza.

Per il nuovo chip, i ricercatori hanno effettivamente sfruttato principi di IA che, ha osservato Javadi, riducono il consumo di elettricità per l’elaborazione del segnale.

Come ha spiegato, i LLM inviano e ricevono molti dati tramite connessioni cablate, che sono collegamenti di comunicazione in rame nei data centre. L’intero processo richiede energia significativa, quindi una possibile “soluzione è sviluppare chip di comunicazione cablata più efficienti.”

Javadi ha inoltre osservato che quando i dati vengono inviati ad alta velocità, si corrompono al ricevitore e, di conseguenza, devono essere ripuliti. A tal fine, la maggior parte dei sistemi di comunicazione cablata esistenti utilizza un equalizzatore, che consuma molta energia.

“Stiamo utilizzando questi principi di IA sul chip per recuperare i dati in modo più intelligente ed efficiente, addestrando il classificatore on‑chip a riconoscere e correggere gli errori.”

– Javadi

Sebbene sia un grande sviluppo, questa è solo la versione iniziale del chip. La sua prossima iterazione è attualmente in fase di sviluppo per migliorare ulteriormente l’efficienza energetica.

Nel complesso, questa ricerca in corso mostra un grande potenziale per avere implicazioni di vasta portata sul futuro dell’infrastruttura IA e delle operazioni dei data centre. Ma, naturalmente, ciò richiederebbe l’implementazione su larga scala della tecnologia, il che non è mai un compito facile.

Clicca qui per scoprire come l’IA sta rivoluzionando l’ingegneria dei microchip.

Domare l’appetito energetico dell’IA con innovazioni a tutti i livelli

Questo ultimo sviluppo del chip è solo uno dei numerosi progetti di ricerca che affrontano il problema del consumo energetico dell’IA. Quindi, diamo un’occhiata rapida ai modi innovativi con cui i ricercatori lo hanno affrontato.

Usare la luce per l’efficienza energetica dell’IA

All’inizio di quest’anno, gli scienziati di USST hanno sviluppato¹ un chip IA microscopico, più piccolo di un granello di polvere o di sale, che utilizza la luce per elaborare i dati provenienti da cavi in fibra ottica. Questo promette calcoli più rapidi con un consumo energetico inferiore.

Il chip manipola la luce per eseguire calcoli istantaneamente anziché interpretare i segnali luminosi come fanno i computer tradizionali. Per questo utilizza una “rete neurale profonda diffrattiva totalmente ottica”, una tecnologia che sfrutta strati stampati in 3D di componenti sovrapposti. Sebbene rivoluzionario, bisogna superare sfide come la progettazione specifica per compiti, la sensibilità alle imperfezioni e la difficoltà di produzione su larga scala per raggiungere “funzionalità senza precedenti” nell’imaging endoscopico, nel calcolo quantistico e nei data centre.

Qualche mese prima, gli scienziati del MIT hanno anche usato la luce per eseguire le operazioni chiave di una rete neurale su un chip, consentendo calcoli IA ultraveloci (in mezzo nanosecondo) con un’accuratezza del 92% e una enorme efficienza energetica.

“Questo lavoro dimostra che il calcolo — nella sua essenza, la mappatura di input a output — può essere compilato su nuove architetture di fisica lineare e non lineare che consentono una legge di scala fondamentalmente diversa tra computazione e sforzo necessario.”

– Autore senior Dirk Englund

Gli scienziati hanno sviluppato il chip fotonico², composto da moduli interconnessi che formano una rete neurale ottica. È notevole che l’uso di processi di fonderia commerciali per la sua fabbricazione consenta di scalarlo e integrarlo nell’elettronica. Inoltre, gli scienziati hanno superato la sfida della non linearità nell’ottica progettando unità di funzione ottica non lineare (NOFUs) che combinano elettronica e ottica.

Clicca qui per saperne di più sulla nuova IA ispirata al cervello che apprende in tempo reale usando energia ultra‑bassa.

Uno strumento software per l’addestramento IA e un sistema di raffreddamento per i data centre

Cooling System for Data Centres

I ricercatori dell’Università del Michigan, nel frattempo, hanno mirato allo spreco energetico generato durante l’addestramento dell’IA, più specificamente quando è distribuito in modo non uniforme tra le GPU, necessarie per elaborare enormi set di dati.

Così, hanno sviluppato uno strumento software chiamato Perseus che identifica i sottocompiti che richiederanno più tempo per essere completati e poi riduce la velocità dei processori non presenti in questo ‘percorso critico’ per consentire a tutti di completare i loro compiti contemporaneamente, eliminando l’uso di energia non necessario.

Questo strumento open‑source è disponibile come parte di Zeus, uno strumento per misurare e ottimizzare il consumo energetico dell’IA.

Nel frattempo, i ricercatori dell’Università del Missouri si sono rivolti a progettare un sistema di raffreddamento di nuova generazione per aiutare i data centre a diventare più efficienti dal punto di vista energetico. Stanno anche fabbricando un sistema di raffreddamento per una facile connessione e disconnessione all’interno dei rack dei server.

“Il raffreddamento e la produzione di chip vanno di pari passo. Senza un adeguato raffreddamento, i componenti si surriscaldano e falliscono. I data centre a basso consumo energetico saranno fondamentali per il futuro del calcolo IA.”

– Chanwoo Park, professore di ingegneria meccanica e aerospaziale al Mizzou College of Engineering

Con il supporto di 1,5 milioni di dollari di finanziamento dall’iniziativa COOLERCHIPS del DOE, il team ha sviluppato un sistema di raffreddamento a due fasi che dissipa il calore dai chip dei server tramite cambi di fase. Non solo può funzionare passivamente senza consumare energia quando è necessario meno raffreddamento, ma anche in modalità attiva, il sistema utilizza una quantità molto piccola di energia.

CRAM Hardware potrebbe ridurre il consumo energetico dell’IA di 1000 volte

L’estate scorsa, gli ingegneri dell’Università del Minnesota Twin Cities hanno sviluppato un dispositivo hardware avanzato³ che potrebbe ridurre il consumo energetico dell’IA di circa 1.000 volte.

Questo nuovo modello si chiama memoria ad accesso casuale computazionale (CRAM) e, in questo caso, i dati non lasciano mai la memoria; vengono invece elaborati interamente all’interno dell’array di memoria, eliminando così la necessità di trasferimenti di dati lenti e ad alta intensità energetica.

Frutto di due decenni di lavoro, questo studio fa parte degli sforzi del team di costruire sulla ricerca brevettata del co‑autore senior Jian‑Ping Wang sui dispositivi a giunzione tunnel magnetica (MTJ). Questi dispositivi nanostrutturati sono usati per migliorare sensori, hard disk e altri sistemi microelettronici come la memoria ad accesso casuale magnetica (MRAM).

“Come substrato di calcolo digitale in‑memoria estremamente efficiente dal punto di vista energetico, CRAM è molto flessibile poiché il calcolo può essere eseguito in qualsiasi punto dell’array di memoria,” ha osservato la co‑autrice Ulya Karpuzcu, professore associato nel Dipartimento di Ingegneria Elettrica e Informatica. Inoltre, può essere riconfigurato per soddisfare al meglio le esigenze di prestazione di diversi algoritmi.

IA ispirata al cervello: ridurre il consumo energetico imitandone l’efficienza umana

Quindi, come abbiamo visto, i ricercatori stanno esaminando diversi aspetti dell’IA per affrontare i suoi problemi energetici. Curiosamente, si stanno anche ispirando al cervello umano. Questo ha senso, poiché l’IA è la simulazione dei processi di intelligenza umana da parte delle macchine, anche se è lontana dal pensiero e dal ragionamento umano a causa della sua capacità di generalizzare attraverso variazioni, risultando “significativamente più debole della cognizione umana”.

La ricerca sulla riduzione energetica ispirata al cervello include il lavoro del professore associato Chang Xu del Sydney AI Centre dell’Università, che ha osservato che i LLM che utilizzano le risorse a piena capacità, anche per compiti semplici, non è il modo corretto di procedere. Ha spiegato:

“Quando pensi a un cervello umano sano – non attiva tutti i neuroni né utilizza tutta la sua potenza cerebrale contemporaneamente. Funziona con un’efficienza energetica incredibile, solo 20 Watt di potenza nonostante abbia circa 100 miliardi di neuroni, che utilizza selettivamente da diversi emisferi del cervello per svolgere compiti o pensieri diversi.”

Pertanto, stanno sviluppando algoritmi che bypassano i calcoli ridondanti non necessari e non entrano automaticamente in modalità ad alta velocità.

In altri casi, la ricerca si è ispirata alla neuromodulazione del cervello e ha creato un algoritmo chiamato ‘sistema di stoccaggio’ per ridurre l’energia del 37% senza alcuna degradazione della precisione, la funzione di auto‑riparazione delle cellule cerebrali chiamata astrociti per dispositivi hardware, e ha ottenuto una forma di calcolo neuromorfico (ispirata al cervello) (memristori) per lavorare insieme in diversi sottogruppi di reti neurali.

Investire nell’intelligenza artificiale

Una società globale di semiconduttori, AMD (AMD ) è nota per le sue tecnologie di calcolo ad alte prestazioni, grafica e visualizzazione. Pur concorrendo direttamente con il favorito dell’IA NVIDIA (NVDA ), sta rapidamente guadagnando terreno nei mercati dei data centre e degli acceleratori IA. La sua serie MI300 è specificamente rivolta ai carichi di lavoro di IA di nuova generazione e alle applicazioni HPC.

La sua presenza dominante nello spazio CPU per data centre, il forte focus su R&D, la crescita dei ricavi, la clientela e le acquisizioni rendono AMD un attore importante nel settore.

Advanced Micro Devices (AMD )

Nel 2022, AMD ha concluso un accordo record nel settore dei chip del valore di 50 miliardi di dollari con l’acquisizione di Xilinx per diventare il leader dell’industria nel calcolo ad alte prestazioni e adattivo. E più recentemente, ha completato l’acquisizione di ZT Systems per affrontare l’opportunità da 500 miliardi di dollari di acceleratori IA per data centre entro il 2028.

Le performance di mercato di AMD stanno anche recuperando quest’anno dopo essere state colpite da turbolenze tariffarie. Al momento della stesura, le azioni AMD sono quotate a 120 $, in calo del 6,9% YTD ma solo circa il 47% rispetto al picco di marzo 2024. Con ciò, la sua capitalizzazione di mercato è di 182,34 miliardi di dollari con un EPS (TTM) di 1,36 e un P/E (TTM) di 82,44.

Per quanto riguarda i dati finanziari dell’azienda, AMD ha riportato un aumento del 36% anno su anno dei ricavi, raggiungendo 7,4 miliardi di dollari per il Q1 2025, che la CEO Dr.ssa Lisa Su ha definito “un avvio eccezionale” per l’anno, “nonostante l’ambiente macro e normativo dinamico.” Questa crescita è stata guidata da “l’espansione del data centre e lo slancio dell’IA,” ha aggiunto.

Durante questo periodo, il reddito operativo di AMD è stato di 806 milioni di dollari, l’utile netto di 709 milioni di dollari e l’utile per azione diluito è stato di 0,44 $. Per il Q2 2025, prevede circa 7,4 miliardi di dollari di ricavi.

Alcuni sviluppi chiave dell’azienda includono l’espansione delle partnership strategiche con Meta Platforms, Inc. (META ) (Llama), Alphabet Inc. (GOOGL ) (Gemma), Oracle Corporation (ORCL ), Core42, Dell Technologies (DELL ), e altri. AMD, insieme a Nokia, Cisco Systems, Inc. (CSCO ), e Jio, hanno anche annunciato una nuova Open Telecom AI Platform per offrire soluzioni guidate dall’IA per migliorare efficienza, sicurezza e capacità.

Questa settimana, AMD e Nvidia hanno collaborato con Humain, una controllata focalizzata sull’IA del Public Investment Fund dell’Arabia Saudita, per fornire semiconduttori per un progetto di data centre su larga scala che dovrebbe avere una capacità di 500 MW.

Clicca qui per un elenco delle principali aziende di calcolo non‑silicio.

Ultime tendenze e sviluppi di Advanced Micro Devices (AMD)

Conclusione

Negli ultimi anni, la frenesia per l’IA ha registrato una crescita esplosiva, e per buoni motivi. Questa tecnologia, dopotutto, ha un grande potenziale per trasformare una vasta gamma di settori, dalla sanità, alla manifattura e alla scienza dei materiali, fino a finanza, intrattenimento, istruzione, retail e cybersicurezza.

Tuttavia, l’avanzamento tecnologico, la crescente adozione e l’espansione successiva di questi LLM hanno comportato una notevole domanda di energia, che contribuisce alle emissioni di gas serra (GHG) e al cambiamento climatico, aumenta i costi economici e influisce sulla sostenibilità della tecnologia.

Ciò rappresenta una grande sfida per l’IA. Se vogliamo realizzare pienamente il suo vero potenziale in termini di costi ridotti, maggiore produttività e decisioni migliorate su larga scala, i modelli devono raggiungere convenienza economica e sostenibilità.

Il lato positivo, però, è che i ricercatori di tutto il mondo stanno già lavorando intensamente per rendere l’IA più efficiente dal punto di vista energetico, come dimostra il chip alimentato dall’IA dell’Oregon State, che suggerisce una forte possibilità di allineare l’innovazione alla sostenibilità.

Naturalmente, le tecnologie proposte devono superare il loro più grande ostacolo per ottenere un impatto reale, la scalabilità. Tuttavia, una cosa è chiara: il futuro dell’IA più verde è fattibile, ed è in arrivo!

Clicca qui per scoprire tutto sull’investire nell’intelligenza artificiale.

Studi citati:

1. Yu, H., Huang, Z., Lamon, S., Wu, J., Zhao, Z., Lin, D., Zhao, H., Zhang, J., Lu, C., Liu, H., Zhang, X., & Zhang, C. (2025). All‑optical image transportation through a multimode fibre using a miniaturized diffractive neural network on the distal facet. Nature Photonics, 19, 486–493. https://doi.org/10.1038/s41566-025-01621-4
2. Bandyopadhyay, S., Sludds, A., Krastanov, S., Youssry, A., Zhang, L., Lian, C., Yu, S., Desiatov, B., Burek, M. J., Lukin, M. D., & Lončar, M. (2024). Single‑chip photonic deep neural network with forward‑only training. Nature Photonics, 18, 1335–1343. https://doi.org/10.1038/s41566-024-01567-z
3. Lv, Y., Zink, B. R., Bloom, R. P., Roy, A., Vaddi, K., Shang, L., & Manipatruni, S. (2024). Experimental demonstration of magnetic tunnel junction‑based computational random‑access memory. npj Unconventional Computing, 1, 3. https://doi.org/10.1038/s44335-024-00003-3