Intelligence artificielle
Technologies émergentes qui façonnent l’avenir du matériel d’IA

Un nouveau type d’informatique
Au cours des dernières années de progrès exponentiel de la technologie IA, les principaux gagnants ont été les constructeurs de matériel d’IA. En effet, l’IA moderne, qui utilise principalement la technologie des réseaux neuronaux, exploite la puissance de calcul d’une manière très différente de celle des ordinateurs classiques.
Au lieu d’effectuer des calculs complexes avec un CPU puissant, ils réalisent des milliers voire des millions de calculs plus simples en parallèle.
(Vous pouvez en savoir plus sur la façon dont les réseaux neuronaux ont été inventés et fonctionnent dans “Investir dans les réalisations du prix Nobel – Réseaux neuronaux artificiels, la base de l’IA”)
Jusqu’à présent, les cartes graphiques, ou GPU (unités de traitement graphique), ont été l’outil privilégié pour développer l’IA, augmentant de façon spectaculaire les revenus et les bénéfices des leaders du secteur comme Nvidia (NVDA ).
Le marché du matériel d’IA devrait continuer à croître de façon exceptionnelle, avec un TCAC de 31,2: % de 2025 à 2035

Source: Roots Analysis
Cette période devrait également voir l’émergence de nombreux nouveaux types de matériel d’IA, les GPU réaffectés aux calculs d’IA étant progressivement remplacés par des puces conçues spécifiquement pour cette application.
À long terme, des formes d’informatique plus exotiques sont susceptibles de pénétrer le marché du matériel d’IA, allant des conceptions spécifiques à l’application aux puces non-siliconées, voire en utilisant de véritables neurones biologiques.
Comment fonctionne la pensée de l’IA
La différence fondamentale entre les superordinateurs classiques et les IA réside dans la façon dont les données sont traitées. Au lieu de résoudre des calculs complexes, les réseaux neuronaux créent des nœuds virtuels reliés entre eux. Alors que le réseau neuronal initial ne comportait que quelques dizaines de nœuds, établissant quelques centaines de connexions, les réseaux neuronaux modernes comme ceux utilisés par ChatGPT utilisent des billions de connexions possibles, atteignant des niveaux de complexité similaires à ceux du cerveau humain.

Source: Nobel Prize
Cette méthode de calcul différente nécessite un matériel capable d’effectuer des millions d’opérations en parallèle, même si la puissance de calcul allouée à chacune est relativement faible.
Heureusement, il s’agit d’un type de matériel déjà utilisé depuis de nombreuses années, comme le rendu graphique avec les GPU, principalement pour la simulation 3D et les jeux vidéo, qui utilise également ce type de nombreux petits calculs en parallèle.
C’est pourquoi le premier (et actuel) gagnant de la course à l’obtention d’assez de puces IA a été Nvidia, le leader du marché des GPU.
Des GPU toujours plus rapides
Avec l’invention d’algorithmes plus efficaces et les progrès rapides de l’intelligence artificielle qu’ils ont engendrés, les applications potentielles de l’IA ont explosé dans les années 2020.
Cela a conduit à une course toujours croissante pour sécuriser suffisamment de matériel, en particulier les GPU Nvidia en 2023.
Parallèlement, les attentes croissantes concernant les applications potentielles de l’IA exigent une IA toujours plus intelligente, ce qui nécessite davantage de puissance de calcul. Et bien que l’obtention de plus de GPU ait été une solution, des GPU meilleurs étaient également nécessaires.
L’industrie a répondu, avec une croissance de performance de 1 000 fois en moins de 8 ans.

Source: NVIDIA
Est-ce durable ?
Il y a des signes que les progrès des performances des GPU pourraient bientôt ralentir. Tout d’abord, toutes les améliorations « faciles », comme rendre les GPU plus grands avec des transistors plus petits et plus denses, atteignent leurs limites. Ainsi, les améliorations futures devront provenir de refontes plus radicales et d’innovations.
Des problèmes secondaires s’infiltrent également dans l’industrie. Par exemple, des GPU beaucoup plus denses et puissants génèrent beaucoup de chaleur résiduelle, au point que davantage du même type ferait simplement fondre les puces.
Cette chaleur résiduelle indique également une grande quantité d’énergie gaspillée. Sécuriser un approvisionnement suffisant en énergie stable de base devient un problème pour les entreprises d’IA, avec tous les géants de la technologie se précipitant pour sécuriser l’approvisionnement auprès des centrales nucléaires.
Enfin, le calcul IA devient plus spécialisé, avec différentes méthodologies émergentes dans différentes entreprises et pour différentes applications, chacune ayant des exigences différentes concernant le matériel. Ainsi, il est très probable que l’ère des GPU polyvalents utilisés par toutes les entreprises d’IA touche à sa fin, même si cela se fait lentement.
L’ère des super GPU
Jusqu’à présent, la plupart des centres de données IA consistaient à relier des milliers de GPU dans des serveurs dédiés.
La solution immédiate au problème croissant de surchauffe et de consommation d’énergie sera la construction d’un matériel intégré qui dépasse le simple assemblage de GPU individuels.
Une étape majeure dans cette direction est la récente sortie par Nvidia du GB200 NVL72. Ce matériel est conçu pour fonctionner comme un GPU massif unique, le rendant beaucoup plus puissant même que le modèle H100, qui détenait auparavant le record.
Cela devrait également être beaucoup plus économe en énergie, un point crucial alors que l’industrie de l’IA pourrait manquer d’énergie avant de manquer de puces, compte tenu de la vitesse à laquelle les centres de données IA sont construits. Et une plus grande efficacité de calcul et énergétique signifie moins de chaleur résiduelle, ce qui résout temporairement le problème de surchauffe.

Source: Nvidia
Actuellement, CoreWeave est devenu le premier fournisseur de cloud avec des instances Nvidia GB200 NLV72 instances.
(Vous pouvez en savoir plus sur CoreWeave et son offre de cloud IA aux entreprises développant des solutions IA dans «CoreWeave : le hyperscaler IA du cloud»).
Matériel d’IA non GPU
Réseaux de portes logiques programmables (FPGAs)
Un autre type de matériel utilisé pour le développement de l’IA est le Field-Programmable Gate Array. Les FPGA sont des circuits intégrés qui peuvent être reprogrammés pour exécuter des tâches spécifiques de manière plus efficace. Ils fonctionnent grâce à des interconnexions configurables entre leurs composants.

Source: Microcontrollers Labs
Cela peut rendre les FPGA plus flexibles que les GPU et offrir davantage de potentiel d’optimisation pour des types de calculs spécifiques.
Les FPGA sont également plus économes en énergie que les GPU. Leur faible latence (temps de réaction rapide) les rend très efficaces pour des applications réelles nécessitant des réactions rapides.
Cependant, les FPGA sont moins capables de gérer des calculs très exigeants nécessitant beaucoup de puissance.
Un autre problème est que, bien que les FPGA soient reprogrammables, cela peut être un processus long et coûteux en main-d’œuvre. Ainsi, ils peuvent être beaucoup plus lents à concevoir, fabriquer et programmer. Cela peut constituer un problème sérieux dans un domaine qui progresse de façon révolutionnaire tous les six mois.
Cela signifie que, jusqu’à présent, les cas d’utilisation des FPGA se sont concentrés sur certaines applications de l’IA, le développement général s’appuyant encore sur des GPU moins efficaces mais polyvalents:
- Traitement en temps réel: Lorsque les données entrantes doivent être traitées rapidement, comme pour le traitement du signal numérique, les systèmes radar, les véhicules autonomes et les télécommunications.
- Accélération matérielle personnalisée: Les FPGA configurables peuvent être ajustés pour accélérer des tâches d’apprentissage profond spécifiques et des clusters HPC en optimisant pour des types de données ou des algorithmes particuliers.
- Ainsi, les centres de données IA modernes pourraient progressivement devenir un mélange de GPU et de FPGA, chaque matériel étant dédié aux sous-tâches qu’il exécute le mieux.
- Edge computing: Il s’agit de rapprocher les capacités de calcul et de stockage localement de l’utilisateur final, par exemple directement dans une voiture ou un drone. Dans ces cas, la faible consommation d’énergie et la taille compacte des FPGA sont des avantages.
Circuits intégrés spécifiques à l’application (ASICs)
Les systèmes ASIC sont conçus pour des types de calcul spécifiques et ne peuvent exécuter que ceux-ci. Ce n’est donc pas tant une puce d’ordinateur qu’un circuit intégré pur ; les FPGA sont parfois également appelés ASIC programmables.
La raison d’utiliser des ASIC plutôt que des FPGA ou des GPU est que les ASIC sont beaucoup plus rapides que tout autre dispositif logique. Ils sont également plus économes en énergie et plus compacts.
C’est pourquoi, par exemple, les mineurs ASIC sont utilisés dans le minage de cryptomonnaies, le design étant optimisé pour exécuter le type de calcul spécifique requis.

Source: Wevolver
Cependant, les ASIC sont également beaucoup plus complexes à concevoir, il n’est donc judicieux de développer un ASIC que pour une tâche qui sera répétée suffisamment souvent pour couvrir les coûts de conception. Dans l’ensemble, les ASIC n’ont un sens économique que lorsqu’ils sont envisagés pour une production de masse.
Les conceptions personnalisées nécessitent également une expertise pointue, et les langages de programmation et bibliothèques largement utilisés peuvent ne pas être compatibles.
Ce besoin de conception sur mesure peut toutefois constituer un avantage, car il crée une protection supplémentaire de la propriété intellectuelle (PI).
Les cas d’utilisation des ASIC sont similaires à ceux des FPGA : edge computing, reconnaissance d’images, télécommunications et traitement du signal, mais, encore plus que les FPGA, ils nécessitent un calcul souvent répété.
Parce qu’ils ne sont pas flexibles, il est peu probable qu’ils suffisent à eux seuls pour des tâches d’IA complexes. Ils peuvent toutefois être intégrés à un système matériel d’IA pour lui apporter davantage d’efficacité et de rapidité.
Notamment, des entreprises comme Etched développent des ASIC spécialement conçus pour effectuer les calculs de transformateurs (le « T » de chatGPT).

Source: Etched
Puces neuromorphiques
Au-delà de l’amélioration des GPU ou de la création d’ASIC plus efficaces, d’autres concepts cherchent à changer complètement la façon dont le calcul est effectué.
Une idée est que si nous concevons un réseau neuronal, nous devrions disposer d’une architecture de puce qui le reflète.
C’est l’idée des puces neuromorphiques, qui fonctionnent comme des neurones interconnectés au niveau matériel au lieu de les simuler via des équations mathématiques complexes et des millions de calculs parallèles.
Ces dispositifs sont également parfois appelés NPU (Unité de traitement neuronal), combinant généralement de nombreux types de composants en une seule unité.
Les puces neuromorphiques utilisent souvent des signaux électriques complexes, plus proches de données analogiques. Cela diffère des ordinateurs « normaux » qui utilisent une architecture de Von Neumann avec des signaux binaires (0 et 1).

Source: Tech Target
De nombreuses méthodes sont actuellement explorées pour créer des puces neuromorphiques :
- Exploiter la ferroélectricité naissante, un phénomène encore mal compris.
- Substrat actif utilisant du vanadium ou du titane.
- Utiliser des memristors, un nouveau type de composant électronique, qui peut exécuter des tâches d’IA avec 1/800ème de la consommation d’énergie normale.
Puces photonique
Une autre option pour contourner de nombreuses limitations actuelles du matériel en silicium est de passer aux ordinateurs photoniques. Au lieu que les électrons transportent l’information, ce sont les photons des lasers qui le font.
Cette méthode présente l’avantage d’être beaucoup moins sensible à la surchauffe et que la lumière est la chose la plus rapide de l’Univers.
Pour l’instant, la durabilité des composants photoniques, notamment la mémoire, a été un problème, mais cela change rapidement.
Autres progrès récents en photonique :
- Transistor à haute mobilité d’électrons ferroélectrique (FeHEMT), réduisant les appareils de communication sur les smartphones.
- Perovskites, plus précisément les cristaux CsPbBr3 (césium-plomb-brome)cristaux, mélangeant la photonique avec les substrats en silicium « normal » et en gallium-arséniure.
- Écriture laser ultra-rapide, pour concevoir des composants photoniques avec du nano-etching.
- Méthode de fabrication de photonique silicon multi-couche.
- Utiliser la magnétite pour créer des ordinateurs spintronique-photonique.
Utilisation de neurones réels
Une autre façon de pousser davantage l’IA à atteindre des performances similaires à celles du cerveau réel est peut-être simplement d’utiliser des cerveaux dès le départ.
Après tout, si un réseau neuronal composé de neurones réels peut être hautement adaptable et exceller dans la reconnaissance de motifs dans la nature, pourquoi ne fonctionnerait-il pas dans un contexte plus artificiel ?
En mars 2025, ce concept a progressé avec la sortie par Cortical Labs du CL1, la première Intelligence Biologique Synthétique (SBI).

Source: Cortical Labs
Les neurones réels sont cultivés dans une solution riche en nutriments, leur fournissant tout ce dont ils ont besoin pour être sains. Ils poussent sur une puce en silicium, qui envoie et reçoit des impulsions électriques dans la structure neuronale.
Cela brouille réellement la frontière entre intelligence artificielle et naturelle. Un ordinateur composé de neurones réels est-il toujours artificiel ?
Nous intégrons les neurones dans le biOS avec un mélange de silicium dur et de tissu mou. Vous pouvez vous connecter directement à ces neurones. Déployez du code directement sur les neurones réels et résolvez les défis les plus difficiles d’aujourd’hui.
Le neurone est auto-programmable, infiniment flexible, et le résultat de quatre milliards d’années d’évolution. Ce que les modèles d’IA numériques dépensent d’énormes ressources à tenter d’imiter, nous le commençons.
Cela pourrait être une véritable percée si certaines théories considérant le cerveau humain davantage comme un ordinateur quantique que comme un système électrique s’avèrent vraies.
Bien que toujours très émergente, cette technologie pourrait recevoir un coup de pouce grâce aux progrès réalisés dans des domaines connexes, comme l’impression 3D d’organes humains, y compris tissu cérébral fonctionnel, ainsi que la production d’organoïdes (mini-cerveaux) par des entreprises comme Final Spark et BiologIC.
Interface cerveau-ordinateur
Une autre façon de renforcer le matériel IA pourrait être de l’utiliser en interface directe avec un autre type de superordinateur biologique : le cerveau déjà présent dans notre crâne et responsable de notre pensée.
Au début, les interfaces cerveau-ordinateur (BCI) seront principalement utilisées pour aider les personnes souffrant de troubles neurologiques.
De nouvelles méthodes pour rendre les implants plus durables et moins invasifs devraient également aider.
À long terme, cela pourrait également brouiller la frontière entre l’intelligence machine et humaine. Si vous pensez à quelque chose avec l’aide d’une IA en interaction directe avec nous via une BCI, qui a réellement pensé ?
Cependant, en raison de préoccupations éthiques et de sécurité, il s’agit probablement de l’une des technologies les plus lointaines, malgré les anticipations de la science-fiction comme Altered Carbon, Neuromancer, ou Cyberpunk 2077.
(Nous avons couvert les entreprises les plus en vue du secteur dans «5 meilleures entreprises d’interfaces cerveau-ordinateur (BCI)»).
Quelle quantité de calcul est réellement nécessaire ?
DeepSeek
Pendant de nombreuses années, chaque entreprise d’IA s’est lancée dans une course pour ajouter le plus de calcul possible le plus rapidement possible, en supposant que plus est toujours mieux.
Cela a été remis en question par l’arrivée brutale de la société chinoise d’IA DeepSeek. Avec un modèle 10 à 100 fois plus efficace que ses concurrents, et ne coûtant que 3 % à 5 % pour une performance équivalente ou supérieure, DeepSeek a remis en question la nécessité d’une puissance de calcul supplémentaire pour créer de meilleures IA.
Une grande raison pour laquelle DeepSeek s’est tant concentré sur l’efficacité du modèle était l’accès limité des entreprises chinoises d’IA aux puces IA. Cela est devenu évident peu après le lancement, lorsqu’il a été révélé que les modèles IA d’autres entreprises chinoises étaient tout aussi impressionnants : Qwen d’Alibaba, Kimi de Moonshot AI, Doubao de ByteDance ou Ernie Bot de Baidu.
Comme le dit le proverbe, « La nécessité est la mère de l’invention ».
Il est probable que dans les années à venir, un double accent sur de meilleures performances et une plus grande efficacité dominera l’industrie de l’IA.
Cependant, cela ne signifie pas que davantage de calcul ne produira pas de meilleurs résultats. Simplement, ce n’est pas le seul chemin vers le succès dans l’industrie de l’IA, et des entreprises très bien financées comme OpenAI ont peut-être été un peu laxistes dans leurs dépenses.
Pour l’instant, la plupart des IA sont en cours de développement et restent des conceptions expérimentales avec des applications limitées. Plus elles sont intégrées dans le flux de travail de millions d’entreprises à travers le monde, plus la puissance de calcul IA sera requise.
Et plus la puissance de calcul est nécessaire, plus la demande de matériel plus efficace et moins énergivore augmente.
Ainsi, comme pour l’informatique traditionnelle, nous pouvons supposer que le marché continuera d’exiger des puces toujours plus performantes, surtout que l’IA pourrait bientôt devenir l’un des plus grands consommateurs d’énergie au monde.
EdgeAI et PC IA
Un autre effet de l’émergence de DeepSeek et d’autres modèles d’IA chinois à exigences de calcul moindres est que les modèles d’IA, en particulier les modèles « distillés », peuvent désormais fonctionner sur des machines individuelles haut de gamme, au lieu de gigantesques centres de données IA à l’échelle du gigawatt.
Cela confirme les partisans d’EdgeAI, qui soutiennent qu’une grande partie du calcul IA doit être effectuée « sur site », plutôt que uniquement dans le cloud.
Comme DeepSeek est un modèle open source, cela ouvre également la voie à de nombreuses expériences individuelles avec des ordinateurs IA : suffisamment puissants pour exécuter des modèles IA, mais assez bon marché et compacts pour être achetés par des particuliers. Dans l’ensemble, cela ne conduit pas tant à une moindre demande de calcul IA, mais plutôt à un processus plus décentralisé pour développer et utiliser des applications IA.
Ainsi, les PC IA sont susceptibles de devenir la nouvelle grande tendance dans la construction de PC, la presse spécialisée discute déjà en détail de la question et de la meilleure marque surtout que l’IA s’infiltre dans la plupart des offres des entreprises technologiques, y compris Microsoft (MSFT ), Copilot devenant presque omniprésent dans Windows OS et d’autres logiciels de la société.
Conclusion
Des GPU de jeu, le matériel pour l’IA évolue rapidement. Cela a commencé avec des GPU conçus pour l’IA et évolue avec les « super GPU » conçus de zéro pour s’intégrer aux centres de données IA avec une consommation d’énergie et une production de chaleur réduites.
L’étape suivante sera probablement une intégration plus poussée des GPU généralistes avec des puces ASIC et FPGA pour exécuter des tâches IA spécifiques avec moins de puissance et d’espace.
À plus long terme, les paris portent sur la technologie qui remportera la course du calcul IA : puces neuromorphiques, photonique, spintronique, voire de véritables neurones biologiques entraînés à interagir avec des substrats en silicium, et peut-être l’IA interagissant directement avec nos propres cerveaux via des interfaces directes.
Pour toutes ces technologies, il est certain que la croissance explosive de la capacité de l’IA et la croissance explosive des applications associées maintiendront la demande de matériel IA plus nombreux et meilleurs.
Ainsi, même si des modèles d’IA plus efficaces arrivent sur le marché, comme DeepSeek, la ruée soudaine de la demande pour les PC IA pourrait être un bon indicateur que le matériel IA restera probablement en offre quelque peu limitée par rapport à la demande dans les années à venir.
Un leader du matériel d’IA
Nvidia
(NVDA )
NVIDIA est passée d’une société de semi-conducteurs de niche spécialisée dans les cartes graphiques à un géant technologique à la pointe de la révolution IA et de la quantité massive de matériel dont elle a besoin.
Cela a été réalisé grâce au développement de CUDA, une interface de programmation à usage général pour les GPU de NVIDIA, ouvrant la porte à des utilisations autres que le jeu vidéo.
« Les chercheurs ont réalisé qu’en achetant cette carte de jeu appelée GeForce, vous l’ajoutez à votre ordinateur et vous avez essentiellement un superordinateur personnel. Dynamique moléculaire, traitement sismique, reconstruction CT, traitement d’images — toute une série de choses différentes. »Jensen Huang, dans une interview avec Sequoia
Cette adoption plus large des GPU, et plus spécifiquement du matériel NVIDIA, a créé une boucle de rétroaction positive basée sur les effets de réseau : plus d’utilisations, plus d’utilisateurs finaux et de programmeurs familiers avec, plus de ventes, plus de budget R&D, plus d’accélération de la vitesse de calcul, plus d’utilisations, etc.

Source: Nvidia
Aujourd’hui, la base installée comprend des centaines de millions de GPU CUDA.
Un autre fait remarquable concernant l’évolution de la puissance de calcul IA est qu’elle suit une loi exponentielle plutôt que la loi de Moore plus linéaire pour les CPU. Cela s’explique non seulement par l’amélioration du matériel GPU, mais aussi par la diminution de la puissance de traitement requise grâce aux améliorations radicales dans la façon dont les réseaux neuronaux sont entraînés.
Bien que leader du GPU et de l’IA, NVIDIA est également très active dans le développement de l’informatique quantique comme nouveau moteur de croissance.
De la même manière qu’elle a déployé CUDA pour les applications de réseaux neuronaux, Nvidia a lancé CUDA-Q pour l’informatique quantique, offrant un système cloud quantique où vous pouvez louer la capacité de calcul quantique NVIDIA via un service cloud.

Source: NVIDIA
Cela inclut également des technologies telles que cuQuantum de NVIDIA pour permettre aux chercheurs d’émuler des ordinateurs quantiques, cuPQC pour le chiffrement quantique, et DGX Quantum pour l’intégration du calcul classique et quantique.
Dans l’ensemble, NVIDIA est à l’avant-garde de la construction d’un écosystème d’informatique quantique, capitalisant sur sa position de leader en IA et matériel IA.

Source: NVidia
Avec une position solide dans l’IA, le minage de cryptomonnaies, et peut-être bientôt l’informatique quantique, Nvidia est très bien placée pour être l’une des entreprises dominantes de matériel informatique dans la prochaine décennie.
Vous pouvez en savoir plus sur l’histoire, le modèle économique et les innovations de Nvidia dans “NVIDIA (NVDA) Spotlight : du géant du graphisme au titan de l’IA“.











