Intelligenza artificiale
Edge AI: Perché AMD è la migliore opportunità di valore per il 2026

L’intelligenza artificiale (AI) è uno dei principali disruptor tecnologici di questo decennio, guidando cambiamenti fondamentali in tutti i settori e nella società in generale.
I dati mostrano che circa una persona su sei a livello globale sta ora utilizzando strumenti di AI generativa. Inoltre, il 90% dei professionisti tecnologici utilizza già l’AI nel proprio lavoro. Nonostante questa adozione, si prevede che il settore dell’AI crescerà ancora di circa 9 volte entro il 2033.
Con questa massiccia adozione aumentano i costi di calcolo, le sfide legate alla latenza e le preoccupazioni sulla sicurezza, il consumo energetico e la scalabilità. Le aziende stanno ora comprendendo che inviare costantemente dati a server remoti per l’inferenza AI — cloud computing o Cloud AI — è costoso, lento e comporta rischi per la privacy.
Nel Cloud AI, le aziende sfruttano le enormi risorse di piattaforme come AWS, Azure e Google Cloud per fornire servizi AI. Questo consente agli utenti di accedere ai modelli AI su richiesta tramite internet senza dover costruire una propria infrastruttura.
La base del Cloud AI sono gli hyperscaler — enormi data center AI che offrono una scalabilità estrema per gestire carichi di lavoro ben al di là delle capacità tradizionali on‑premise. Con le loro vaste reti orizzontali di server, forniscono alle imprese le risorse per accedere, costruire, addestrare, distribuire e mantenere applicazioni AI in modo efficiente.
Questa combinazione di cloud computing e AI offre vantaggi in termini di efficienza dei costi, scalabilità e capacità di sfruttare modelli condivisi. Tuttavia, presenta anche notevoli svantaggi, tra cui costi ricorrenti elevati dovuti a risorse computazionali, storage, trasferimento dati e competenze specializzate necessarie per un utilizzo continuo.
Altri problemi del Cloud AI includono latenza, rischi di sicurezza, privacy dei dati, dipendenza da internet, controllo limitato e lock‑in del fornitore.
Poiché il cloud si dimostra costoso e problematico per le app consumer, i laptop, i sistemi industriali e i casi d’uso in tempo reale, le aziende stanno passando a “Edge AI”. Eseguire l’inferenza locale sul dispositivo anziché fare affidamento su costose GPU cloud sta ora ridefinendo il modo in cui l’AI viene distribuita al di fuori dei data center.
Scorri per spostare →
| Dimensione | Cloud AI (Inferenza Centralizzata) | Edge AI (Sul Dispositivo / Inferenza Locale) |
|---|---|---|
| Latenza | I round‑trip di rete aggiungono ritardo; variabile sotto carico | Risposte dell’ordine dei millisecondi; prestazioni stabili |
| Economia Unitaria | Fatture ricorrenti per GPU + larghezza di banda + storage | Costo iniziale del silicio; ammortizzato sulla vita del dispositivo |
| Privacy e Conformità | I dati lasciano il dispositivo; maggiore esposizione + oneri di governance | I dati sensibili possono rimanere locali; superficie di esposizione più bassa |
| Affidabilità | Dipendente da internet + disponibilità del servizio | Funziona offline o in reti degradate |
| Scalabilità | Scala tramite capacità del data center e disponibilità di GPU | Scala distribuendo l’inferenza tra i punti finali |
| Miglior Adattamento | Addestramento, inferenza batch massiva, analisi centralizzate | App in tempo reale: PC, robotica, veicoli, telecamere, industriale |
Edge AI Spiegata: Perché l’Inferenza Si Sta Spostando sul Dispositivo

L’industria sta vivendo un cambiamento strategico e architetturale verso l’Edge AI, spostando l’AI dai data center centralizzati e ad alto consumo energetico verso hardware di inferenza locale.
Nell’Edge AI, l’intelligenza artificiale è combinata con l’edge computing per eliminare la dipendenza dal cloud consentendo ai dispositivi di elaborare i dati localmente. Qui “Edge” si riferisce al dispositivo in uso — come uno smartphone, un’auto, una telecamera, una TV, un sensore o un dispositivo medico — quindi l’edge computing indica il computer progettato per elaborare i dati vicino o all’interno di quel dispositivo.
Oltre ai dispositivi edge che raccolgono ed elaborano i dati, altri componenti chiave includono modelli AI addestrati nel cloud e distribuiti sull’edge, nonché chip hardware specializzati che gestiscono in modo efficiente i compiti AI localmente.
Con questo spostamento verso dispositivi a basso consumo energetico, l’obiettivo è affrontare le problematiche critiche di latenza e privacy dei dati consentendo l’elaborazione in tempo reale sui dispositivi degli utenti, dove i dati vengono effettivamente generati.
Ciò significa che, invece di inviare i dati a un data center esterno, i calcoli vengono eseguiti vicino alla fonte, consentendo ai dispositivi di prendere decisioni in millisecondi senza richiedere una connessione internet. I dati vengono essenzialmente utilizzati proprio nel momento in cui vengono creati dal dispositivo.
Questa elaborazione in tempo reale è fondamentale per la robotica, i veicoli autonomi e le applicazioni di sorveglianza che richiedono tempi di risposta rapidi.
L’edge computing allevia anche l’enorme pressione sui data center eliminando la necessità di spostare i dati avanti e indietro. Nell’Edge AI, solo i dati rilevanti vengono inviati al cloud, riducendo i requisiti di larghezza di banda e i costi associati.
Oltre all’efficacia dei costi, il passaggio da data center su scala gigawatt ai dispositivi offre il vantaggio dell’efficienza energetica, poiché possono eseguire l’AI con un consumo minimo. Mantenendo i dati sensibili localmente, le aziende possono affrontare ulteriormente le preoccupazioni di sicurezza, proteggendo da accessi non autorizzati e violazioni dei dati.
Grazie ai vantaggi di velocità, costo, privacy ed efficienza energetica, l’inferenza AI viene sempre più eseguita all’edge.
Nell’AI, l’inferenza è l’operazione reale del modello — un processo che inizia dopo che il modello è stato addestrato e termina l’apprendimento. L’inferenza è quando il modello inizia a funzionare, trarre conclusioni dai dati e trasformare quella conoscenza in risultati concreti.
L’inferenza locale si riferisce all’esecuzione di modelli AI direttamente sulla macchina dell’utente utilizzando silicio specializzato, come le NPU (Neural Processing Units) integrate nelle CPU o nei system‑on‑chip (SoC), anziché inviare ogni richiesta a una GPU cloud.
Le NPU sono chip AI ottimizzati per calcoli complessi in compiti di deep learning come l’elaborazione del linguaggio naturale, l’elaborazione vocale, il riconoscimento di oggetti e di immagini. Questi chip acceleratori AI specializzati consentono inferenze rapide sul dispositivo con consumo energetico minimo, abilitando applicazioni in tempo reale.
In pratica, l’inferenza locale significa che il tuo laptop, PC, sistema embedded o anche smartphone può eseguire grandi modelli linguistici (query LLM), modelli di visione o carichi di lavoro di assistenti senza ricorrere a server grandi, costosi e potenti.
Ciò riduce la latenza, abbassa i costi di larghezza di banda, migliora la privacy e diminuisce le spese dei server. Poiché i sistemi Edge AI possono operare senza una connessione internet costante, offrono una maggiore affidabilità, rendendoli adatti a zone remote.
Man mano che i carichi di lavoro AI passano dalla sperimentazione all’uso quotidiano, questo spostamento verso l’inferenza locale non è più teorico ma una necessità, poiché miliardi di dispositivi acquisiscono capacità AI e l’inferenza basata sul cloud diventa insostenibile su larga scala.
Le ricerche di mercato sull’Edge AI stimano che i processori AI all’edge possano valere quasi 60 miliardi di dollari entro la fine di questo decennio, rispetto a 9 miliardi nel 2020, guidati principalmente dal calcolo locale in PC e dispositivi.
Già quest’anno, la tendenza dell’inferenza locale è passata da demo di ricerca a prodotti reali, come mostrato al CES 2026, dove decine di PC AI e fattori di forma edge sono stati presentati con capacità di inferenza sul dispositivo.
Ad esempio, Ambarella ha lanciato il suo SoC di visione CV7 con avanzata elaborazione edge AI sul dispositivo per varie applicazioni di percezione in tempo reale. Qualcomm ha raddoppiato l’integrazione verticale per “computing intelligente ovunque” con i suoi PC Snapdragon X Elite Gen 2. Broadcom si sta anche concentrando sull’integrazione di “Neural Engines” nei processori per abilitare l’AI locale, puntando specificamente alle applicazioni per la casa intelligente.
Quando si tratta di giganti come Apple (AAPL ) e NVIDIA (NVDA ), il primo utilizza un modello ibrido di AI sul dispositivo e “Private Cloud Compute”, mentre il secondo sta facendo un passaggio verso la “physical AI” e l’elaborazione sul dispositivo.
La Physical AI, che estende l’AI oltre il mondo digitale verso robotica, droni e macchinari industriali, è una delle tendenze emergenti nel settore Edge AI e si prevede che sarà un importante motore di crescita.
Perché AMD è Posizionata per Vincere il Ciclo Hardware dell’Edge AI
Nel mondo delle azioni Edge AI, uno dei nomi più importanti da tenere d’occhio è Advanced Micro Devices (AMD ), che sviluppa semiconduttori, processori e GPU per data center, AI, gaming e applicazioni embedded.
All’inizio di questo mese, al CES 2026, la presidente e CEO di AMD Lisa Su ha condiviso l’obiettivo dell’azienda di fornire AI a tutti, evidenziando una strategia AI orientata all’edge per PC, dispositivi embedded e sviluppatori, rafforzando l’attenzione dell’azienda sull’hardware di inferenza locale al di là degli ambienti cloud iperscalari.
Come parte di questo approccio, l’azienda ha introdotto una nuova linea di processori AI. Include il processore Ryzen AI 400 Series per PC AI, con NPU integrate che forniscono circa 60 TOPS di calcolo AI per inferenza locale. Questa ultima versione dei chip PC potenziati dall’AI di AMD presenta 12 core CPU e 24 thread e consentirà un multitasking più veloce (1,3x) rispetto ai concorrenti. Sono anche 1,7 volte più rapidi nella creazione di contenuti.
I PC, incluso il processore Ryzen AI 400 Series, saranno disponibili nel trimestre corrente.
In una conferenza stampa, Rahul Tikoo, senior vice president e GM del business client di AMD, ha osservato che hanno già ampliato a oltre 250 piattaforme AI PC, rappresentando una crescita di 2 volte rispetto all’anno scorso. Ha dichiarato:
“Negli anni a venire, l’AI diventerà un tessuto multilivello che si intreccerà in ogni livello del computing a livello personale. I nostri PC e dispositivi AI trasformeranno il modo in cui lavoriamo, giochiamo, creiamo e ci connettiamo gli uni con gli altri.”
AMD ha inoltre introdotto i chip Ryzen AI Max+ al più grande show di elettronica di consumo al mondo. Sono destinati a notebook premium e mini‑PC per inferenza locale avanzata, creazione di contenuti e gaming.
Per gli sviluppatori, AMD ha annunciato la piattaforma Ryzen AI Halo per lo sviluppo di modelli sul dispositivo, pronta a portare potenti capacità di sviluppo AI a un PC desktop compatto nel prossimo trimestre.
Il suo nuovo portafoglio di processori x86 embedded è nel frattempo progettato per alimentare applicazioni AI al edge. I nuovi processori delle serie P100 e X100 offrono calcolo AI ad alte prestazioni per la sanità intelligente, i cruscotti digitali automobilistici e la robotica umanoide.
“Indipendentemente da chi sei e da come usi la tecnologia quotidianamente, l’AI sta rimodellando il computing di tutti i giorni. Hai migliaia di interazioni con il tuo PC ogni giorno. L’AI è in grado di comprendere, apprendere il contesto, introdurre automazione, fornire ragionamento profondo e personalizzazione a ogni individuo.”
– Rahul Tikoo, Senior VP & GM of Client Business
Con queste mosse, il produttore di chip americano sta puntando sui carichi di lavoro AI sul dispositivo e contribuendo alla spinta dell’industria verso l’inferenza locale e l’intelligenza distribuita su miliardi di endpoint.
Oltre a consentire il calcolo AI al edge, l’azienda ha mostrato i suoi avanzati processori AI, utilizzati nei rack dei server dei data center. Una versione enterprise del chip della serie MI400 (il MI440X) è stata progettata per l’uso on‑premise ma non è specificamente destinata ai cluster AI.
Per soddisfare le future esigenze di calcolo di aziende come OpenAI, AMD ha anche presentato in anteprima la piattaforma MI500, che l’azienda afferma sia progettata per consentire guadagni di prestazioni di ordine di grandezza a livello di sistema e rack rispetto alle generazioni precedenti, piuttosto che un semplice upgrade chip uno a uno. I chip saranno lanciati l’anno prossimo.
Oltre a un impressionante portafoglio di prodotti, AMD vanta una eccellente lista di clienti, tra cui OpenAI, Blue Origin, Liquid AI, Luma AI, World Labs, Illumina, Absci, AstraZeneca e Generative Bionics, che hanno sfruttato la tecnologia dell’azienda per trasformare la promessa dell’AI in un impatto reale. Secondo Su:
“Man mano che l’adozione dell’AI accelera, stiamo entrando nell’era del calcolo yotta‑scale, guidata da una crescita senza precedenti sia nell’addestramento che nell’inferenza. AMD sta costruendo la base di calcolo per questa prossima fase dell’AI attraverso una leadership tecnologica end‑to‑end, piattaforme aperte e una profonda co‑innovazione con partner in tutto l’ecosistema.”
In un’intervista, ha osservato che, data la domanda “incredibile” di AI, che sta “andando alle stelle”, sarà necessario un investimento massiccio e inevitabile in potenza di calcolo e hardware all’avanguardia per rimanere competitivi nel mercato AI.
Il mondo, secondo lei, avrebbe bisogno di più di “10 yottaflops” di calcolo, “10.000 volte più calcolo di quello che avevamo nel 2022”, per tenere il passo con la crescita dell’AI. In linea con ciò, ha condiviso il piano dell’azienda per un’infrastruttura yotta‑scale, presentando la piattaforma rack‑scale “Helios” di AMD, che fornirà fino a 3 exaflops di prestazioni AI in un unico rack.
Allo stesso evento, il principale concorrente di AMD, Nvidia, ha lanciato la sua piattaforma Vera Rubin di nuova generazione, composta da sei chip e prevista per il debutto entro la fine di quest’anno.
Ma mentre Nvidia continua a concentrarsi sull’iperscale con mega GPU di alto livello e stack aziendali, AMD sta adottando un approccio diversificato ai suoi prodotti che consentono funzionalità AI a costi totali inferiori. Questo contrasto definisce sempre più il dibattito AMD vs NVIDIA 2026.
AMD sta riducendo i prezzi rispetto a NVIDIA per i chip “AI PC” al fine di catturare una quota più ampia del mercato emergente dei PC AI rendendo i processori ad alte prestazioni più accessibili per OEM e consumatori. Di conseguenza, AMD è considerata una delle azioni AI sottovalutate nel mercato.
Al 20 gennaio 2026, AMD, con una capitalizzazione di mercato di 377,4 miliardi di dollari, è quotata a 231,87 $, in rialzo dell’8,25 % YTD e del 90,87 % nell’ultimo anno. Ha un EPS (TTM) di 1,92 e un P/E (TTM) di 120,97.
(AMD )
Anche la posizione finanziaria di AMD è solida, con Jean Hu, executive vice president, CFO e tesoriere di AMD, che osserva: “I nostri continui investimenti in AI e computing ad alte prestazioni stanno guidando una crescita significativa e posizionando AMD per creare valore a lungo termine.”
Ciò è evidente nel fatturato record della società globale di semiconduttori di 9,2 miliardi di dollari nel terzo trimestre del 2025. Include 4,3 miliardi di dollari dal segmento data center, in crescita del 22 % YoY, 4 miliardi di dollari da ricavi combinati client e gaming, in crescita del 73 % YoY, e 857 milioni di dollari dal segmento embedded, in calo dell’8 % YoY.
Il fatturato di AMD non include ancora le spedizioni dei suoi chip Instinct MI308 in Cina, come ha fatto lo scorso trimestre, sebbene l’azienda preveda presto ricavi da essi. “Abbiamo ricevuto alcune licenze per MI308,” ha osservato Su all’epoca. “Stiamo ancora lavorando con i nostri clienti sull’ambiente di domanda e su quale sia l’opportunità complessiva.”
Il suo reddito operativo per il periodo è stato di 1,3 miliardi di dollari, e l’utile netto di 1,2 miliardi di dollari, mentre il margine lordo è stato del 52 %. L’utile per azione diluito è stato di 0,75 $.
“Abbiamo consegnato un trimestre eccezionale, con fatturato record e redditività che riflettono una domanda diffusa per i nostri processori EPYC e Ryzen ad alte prestazioni e gli acceleratori AI Instinct,” ha detto Su. Questo “segna un chiaro passo avanti nella nostra traiettoria di crescita mentre la nostra franchigia di calcolo in espansione e il business AI dei data center in rapida crescita guidano una significativa crescita di fatturato e utili,” ha aggiunto.
All’epoca, il gigante dei semiconduttori ha osservato che il momentum dei clienti per le sue piattaforme AI sta accelerando, come evidente dal rafforzamento delle partnership con OpenAI, Oracle (ORCL ), Cisco (CSCO ), IBM (IBM ) e Cohere.
Il Dipartimento dell’Energia degli Stati Uniti ha inoltre stipulato una partnership da 1 miliardo di dollari con AMD per costruire due supercomputer di nuova generazione che “potenzieranno” i progressi nello sviluppo di farmaci, nell’energia nucleare e nelle tecnologie di sicurezza nazionale. Il primo, chiamato Lux, sarà alimentato da chip AI MI355X e chip di rete, diventando il primo supercomputer AI factory degli Stati Uniti. Il supercomputer Discovery, più avanzato, sarà basato sulla serie di chip AI MI430.
Per l’ultimo trimestre, AMD prevede un fatturato di circa 9,6 miliardi di dollari e un margine lordo non GAAP del 54,5 %.
La scorsa settimana, il partner di produzione di AMD, TSMC, il più grande produttore di chip su contratto, ha superato le stime di fatturato riportando un aumento del 35 % del profitto del quarto trimestre. L’azienda prevede di aumentare la spesa in conto capitale quest’anno, segnalando fiducia nella costruzione dell’AI.
“Ci aspettiamo che il nostro business sia sostenuto da una domanda costante e forte per le nostre tecnologie di processo all’avanguardia.” – Wendell Huang, CFO di TSMC
Quindi, mentre cerca di tenere il passo con Nvidia, AMD sta spingendo più in profondità negli acceleratori AI, nel computing focalizzato sull’edge e nelle piattaforme a costi contenuti, posizionandosi come un’alternativa convincente guidata dal valore nel panorama AI in evoluzione.
L’Edge AI è il Prossimo Grande Ciclo Hardware
Il panorama AI sta evolvendo a un ritmo rapido, essendo integrato in tutto, dagli smartphone ai dispositivi indossabili, display, droni, robot e veicoli autonomi. Man mano che i modelli AI diventano più efficienti e l’uso della tecnologia passa dalla sperimentazione alla distribuzione e scalabilità, l’industria si sta spostando dal cloud all’edge per tenere il passo con il boom dell’AI.
Mentre Nvidia continua a dominare l’addestramento nei data center e l’inferenza iperscalare con GPU di fascia alta e lock‑in dell’ecosistema, il ciclo hardware si sta ora spostando dai data center centralizzati ai dispositivi di tutti i giorni, dove valore, efficienza e prezzo sono fondamentali. In questa nuova era dell’AI a livello di dispositivo, AMD si distingue per il suo focus strategico sull’inferenza locale, le NPU integrate e i processori AI PC, rendendola una proposta di valore convincente nel 2026.
L’Edge AI è ancora nelle sue fasi iniziali, ma il suo potenziale è immenso. Integrando l’intelligenza in ogni dispositivo, può consentire all’AI di operare ovunque, indipendentemente dalla connettività internet. E man mano che tutto diventa un computer, l’opportunità per l’Edge AI potrebbe rivelarsi enorme, persino più grande del cloud. Tuttavia, piuttosto che sostituirlo, il futuro dell’AI sarà probabilmente ibrido, con le piattaforme cloud che gestiscono l’addestramento e i dispositivi edge che forniscono inferenza in tempo reale, segnando il prossimo grande paradigma di calcolo.
Clicca qui per un elenco delle migliori reti edge per un’esperienza online più veloce e sicura.












