Intelligence artificielle

L’IA rencontre l’efficacité : une nouvelle puce réduit de 50% la consommation d’énergie des LLM

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.
A glowing futuristic AI chip

Le boom actuel de l’intelligence artificielle (IA) entraîne une explosion des centres de données, ce qui crée une demande immense en énergie pour faire fonctionner et refroidir les serveurs qu’ils contiennent.

Bien qu’il existe plus de 8 000 centres de données dans le monde, dont la plupart se trouvent aux États‑Unis, ce nombre augmentera considérablement dans les années à venir. 

Selon les estimations du Boston Consulting Group, la demande de centres de données augmentera de 15 % à 20 % chaque année jusqu’en 2030. À ce stade, l’entreprise prévoit qu’ils représenteront 16 % de la consommation totale d’électricité aux États‑Unis, contre seulement 2,5 % avant le lancement de ChatGPT d’OpenAI en 2022.

Parallèlement, le rapport spécial sur l’énergie et l’IA de l’Agence internationale de l’énergie (AIE) publié cette année prévoit que la demande d’électricité des centres de données du monde entier doublera au moins d’ici la fin de la décennie, atteignant environ 945 TWh. C’est presque l’équivalent de la consommation actuelle du Japon. 

L’organisation intergouvernementale autonome basée à Paris indique que l’IA est le principal moteur de cette hausse, la demande d’électricité des centres de données optimisés pour l’IA devant plus que quadrupler d’ici 2030.

Aux États‑Unis, la consommation d’énergie des centres de données devrait déjà représenter environ la moitié de la croissance de la demande d’électricité entre maintenant et 2030. Sous l’impulsion de l’utilisation de l’IA, l’économie américaine, selon le rapport, consommera plus d’électricité pour traiter les données à ce moment-là que pour fabriquer l’ensemble des biens à forte intensité énergétique.

Cette soif insatiable d’énergie constitue un problème majeur pour le développement et l’adoption de l’IA. Cependant, le point positif réside dans le nombre croissant de chercheurs et d’entreprises qui travaillent à réduire la consommation d’énergie de l’IA et à la rendre plus efficace.

Ce qui est intéressant dans ces initiatives, c’est que beaucoup d’entre elles utilisent l’IA pour résoudre leurs propres défis énergétiques.

Ce mois-ci même, une équipe de chercheurs a démontré une nouvelle puce qui utilise l’IA pour réduire de 50 % l’empreinte énergétique des grands modèles de langage (LLM), marquant une avancée majeure pour rendre les LLM rentables et plus durables à exploiter.

Nouvelle puce exploite l’IA pour réduire la consommation d’énergie des LLM

Nouvelle puce exploite l'IA

Des chercheurs du College of Engineering de l’Université d’État de l’Oregon ont développé cette nouvelle puce IA efficace afin de résoudre le problème massif de consommation d’électricité des applications IA basées sur les LLM, comme GPT‑4 d’OpenAI et Gemini de Google.

Un type de modèle d’apprentissage automatique (ML), le grand modèle de langage (LLM) est pré‑entraîné sur d’énormes quantités de données pour exécuter des tâches de traitement du langage naturel (NLP) telles que la génération de texte, le résumé, la simplification, le raisonnement textuel, la traduction linguistique, etc.

Les chatbots les plus populaires et largement utilisés aujourd’hui incluent GPT‑4o, o3 et o1 d’OpenAI, Gemini et Gemma de Google, Llama de Meta, R1 et V3 de DeepSeek, Claude d’Anthropic, Nova d’Amazon, Phi de Microsoft et Grok de xAI.

Au cours des dernières années, les LLM ont complètement transformé le domaine de l’IA en permettant aux machines de comprendre et de générer du texte semblable à celui des humains avec une précision accrue. Cependant, cette évolution des LLM a entraîné une augmentation exponentielle de leur taille.  

La taille d’un LLM, mesurée par son nombre de paramètres, est le principal facteur de sa consommation d’énergie. Cela signifie que plus le modèle est grand, plus il nécessite de puissance de calcul pour l’entraînement et l’inférence. 

Par exemple, ChatGPT‑1 comptait un peu moins de 120 millions de paramètres, qui ont grimpé à 175 milliards avec GPT‑3, puis à environ 1,8 billion avec GPT‑4.

Cette augmentation massive de la taille et des capacités des LLM implique également que leur consommation d’énergie augmente à une échelle sans précédent. En plus de la taille du modèle, des facteurs tels que le type de matériel utilisé pour entraîner ces LLM, la durée du processus d’entraînement, l’infrastructure (c’est‑à‑dire les centres de données), le traitement des données, l’optimisation du modèle et l’efficacité des algorithmes influencent la consommation d’énergie des LLM.

D’où la nouvelle puce des chercheurs de l’OSU. Selon Tejasvi Anand, professeur associé d’ingénierie électrique à l’OSU qui dirige également le Mixed Signal Circuits and Systems Lab à l’université :

« Le problème est que l’énergie requise pour transmettre un seul bit n’est pas réduite au même rythme que la demande de débit de données augmente. C’est ce qui pousse les centres de données à consommer autant d’énergie. »

Pour surmonter ce problème, l’équipe a conçu et développé une nouvelle puce qui consomme seulement la moitié de l’énergie des conceptions conventionnelles.

Anand et l’étudiant en doctorat Ramin Javad ont présenté cette nouvelle technologie lors de la conférence IEEE Custom Integrated Circuits (CIC), qui s’est tenue à Boston le mois dernier. La conférence, qui accueille forums, panels, expositions et présentations orales, est consacrée au développement des circuits intégrés, qui constituent le bloc de construction des systèmes électroniques modernes en offrant fonctionnalité et puissance de traitement dans un format compact et efficace.

La technologie la plus récente a été développée avec le soutien du Center for Ubiquitous Connectivity (CUbiC), du Semiconductor Research Corporation (SRC) et de la Defense Advanced Research Projects Agency (DARPA). Elle a également valu à Javadi le prix du meilleur article étudiant lors de la conférence.

Pour la nouvelle puce, les chercheurs ont réellement exploité des principes d’IA qui, selon Javadi, réduisent la consommation d’électricité pour le traitement du signal.

Comme il l’explique, les LLM envoient et reçoivent de nombreuses données via des connexions filaires, qui sont des liaisons de communication en cuivre dans les centres de données. Ce processus complet nécessite une énergie importante, ainsi une « solution potentielle consiste à développer des puces de communication filaire plus efficaces ».

Javadi a ajouté que lorsqu’elles sont transmises à grande vitesse, les données sont en réalité corrompues à l’extrémité du récepteur et doivent donc être nettoyées. À cette fin, la plupart des systèmes de communication filaire existants utilisent un égaliseur, qui consomme beaucoup d’énergie.

« Nous utilisons ces principes d’IA sur puce pour récupérer les données de manière plus intelligente et plus efficace en entraînant le classificateur intégré à reconnaître et corriger les erreurs. »

– Javadi

Bien qu’il s’agisse d’une avancée majeure, ce n’est que la version initiale de la puce. Sa prochaine itération est actuellement en cours de développement pour améliorer davantage son efficacité énergétique.

Dans l’ensemble, ces recherches en cours montrent un grand potentiel d’implications à long terme pour l’avenir des infrastructures IA et des opérations des centres de données. Mais bien sûr, cela nécessiterait une mise en œuvre réussie de la technologie à grande échelle, ce qui n’est jamais une tâche facile.

Cliquez ici pour découvrir comment l’IA bouleverse l’ingénierie des micropuces.

Apprivoiser l’appétit énergétique de l’IA grâce à des percées à tous les niveaux

Ce dernier développement de puce n’est qu’un des nombreux projets de recherche qui s’attaquent au problème de consommation d’énergie de l’IA. Jetons donc un bref coup d’œil aux méthodes innovantes que les chercheurs ont mises en œuvre.

Utiliser la lumière pour l’efficacité énergétique de l’IA 

Plus tôt cette année, des scientifiques de l’USST ont développé1 une puce IA microscopique, plus petite qu’un grain de poussière ou de sel, qui utilise la lumière pour traiter les données provenant de câbles à fibre optique. Cela promet des calculs plus rapides avec une consommation d’énergie moindre.

La puce manipule la lumière pour effectuer des calculs instantanément plutôt que d’interpréter les signaux lumineux comme le font les ordinateurs traditionnels. Pour cela, elle utilise un « réseau neuronal profond diffractif tout‑optique », une technologie qui exploite des couches de composants imprimés en 3D et structurés. Bien que révolutionnaire, des défis tels que la conception spécifique à chaque tâche, la sensibilité aux imperfections et la difficulté de production à grande échelle doivent être surmontés pour qu’elle atteigne des « fonctionnalités sans précédent » en imagerie endoscopique, en calcul quantique et dans les centres de données.

Quelques mois auparavant, des scientifiques du MIT ont également utilisé la lumière pour réaliser les opérations clés d’un réseau neuronal sur puce, permettant des calculs IA ultra‑rapides (en une demi‑nanoseconde) avec une précision de 92 % et une efficacité énergétique massive.

« Ce travail montre que le calcul — dans son essence, la correspondance entre entrées et sorties — peut être implémenté sur de nouvelles architectures de physique linéaire et non linéaire qui permettent une loi d’échelle fondamentalement différente entre le calcul et l’effort requis. »

– Auteur principal Dirk Englund

Les scientifiques ont développé la puce photonique2, constituée de modules interconnectés formant un réseau neuronal optique. Notamment, l’utilisation de procédés de fonderie commerciaux pour sa fabrication signifie qu’elle peut être mise à l’échelle et intégrée dans l’électronique. De plus, les scientifiques ont surmonté le défi de la non‑linéarité en optique en concevant des unités fonctionnelles optiques non linéaires (NOFUs) qui combinent électronique et optique.

Cliquez ici pour en savoir plus sur la nouvelle IA inspirée du cerveau qui apprend en temps réel avec une consommation ultra‑faible.

Un outil logiciel pour l’entraînement IA & un système de refroidissement pour les centres de données

Système de refroidissement pour les centres de données

Les chercheurs de l’Université du Michigan, quant à eux, ont ciblé le gaspillage d’énergie généré lors de l’entraînement de l’IA, plus précisément lorsqu’il est réparti de manière inégale entre les GPU, indispensable pour le traitement d’énormes ensembles de données. 

Ils ont donc développé un outil logiciel appelé Perseus qui identifie les sous‑tâches les plus longues à exécuter, puis réduit la vitesse des processeurs qui ne font pas partie de ce « chemin critique » afin de permettre à tous de terminer leurs tâches simultanément, éliminant ainsi la consommation d’énergie inutile.

Cet outil open‑source est disponible dans le cadre de Zeus, un outil de mesure et d’optimisation de la consommation énergétique de l’IA.

Parallèlement, des chercheurs de l’Université du Missouri se sont tournés vers la conception d’un système de refroidissement de nouvelle génération afin d’aider les centres de données à devenir plus efficaces sur le plan énergétique. Ils fabriquent également un système de refroidissement permettant une connexion et une déconnexion faciles au sein des racks de serveurs.

« Le refroidissement et la fabrication de puces vont de pair. Sans un refroidissement adéquat, les composants surchauffent et échouent. Les centres de données à haute efficacité énergétique seront essentiels pour l’avenir du calcul IA. »

Chanwoo Park, professeur de génie mécanique et aérospatial au Mizzou College of Engineering

Grâce au financement de 1,5 million de dollars de l’initiative COOLERCHIPS du DOE, l’équipe a développé un système de refroidissement à deux phases qui dissipe la chaleur des puces serveur via un changement de phase. Non seulement il peut fonctionner passivement sans consommer d’énergie lorsqu’un refroidissement moindre suffit, mais même en mode actif, le système utilise très peu d’énergie.

Le matériel CRAM pourrait réduire la consommation d’énergie de l’IA de 1000 fois

L’été dernier, des ingénieurs de l’Université du Minnesota Twin Cities ont développé un dispositif matériel avancé3 qui pourrait réduire la consommation d’énergie de l’IA d’environ 1 000 fois.

Ce nouveau modèle s’appelle la mémoire à accès aléatoire computationnelle (CRAM) et, dans ce cas, les données ne quittent jamais la mémoire ; elles sont entièrement traitées au sein du tableau mémoire, éliminant ainsi le besoin de transferts de données énergivores et lents.

Fruit de deux décennies de travail, cette étude fait partie des efforts de l’équipe visant à s’appuyer sur les recherches brevetées du co‑auteur principal Jian‑Ping Wang sur les dispositifs à jonction tunnel magnétique (MTJ). Ces dispositifs nanostructurés sont utilisés pour améliorer les capteurs, les disques durs et d’autres systèmes microélectroniques comme la mémoire à accès aléatoire magnétique (MRAM).

« En tant que substrat de calcul numérique en‑mémoire extrêmement économe en énergie, le CRAM est très flexible, car le calcul peut être effectué à n’importe quel endroit du tableau mémoire », a souligné la co‑auteure Ulya Karpuzcu, professeure associée au département d’ingénierie électrique et informatique. De plus, il peut être reconfiguré pour répondre au mieux aux besoins de performance de différents algorithmes.

IA inspirée du cerveau : réduire la consommation d’énergie en imitant l’efficacité humaine

Ainsi, comme nous l’avons vu, les chercheurs examinent différents aspects de l’IA pour résoudre ses problèmes énergétiques. Fait intéressant, ils s’inspirent également du cerveau humain. Cela a du sens, car l’IA est la simulation des processus d’intelligence humaine par les machines, bien qu’elle soit loin d’égaler la pensée et le raisonnement humains en raison de sa capacité à généraliser à travers les variations, étant « significativement plus faible que la cognition humaine ».

Les recherches de réduction énergétique inspirées du cerveau incluent le travail du professeur associé Chang Xu au Sydney AI Centre de l’université, qui a souligné que les LLM utilisant les ressources à pleine capacité, même pour des tâches simples, n’est pas la bonne approche. Il a expliqué :

« Lorsque l’on considère un cerveau humain en bonne santé – il ne déclenche pas tous les neurones ni n’utilise toute sa puissance cérébrale simultanément. Il fonctionne avec une efficacité énergétique incroyable, seulement 20 watts de puissance malgré environ 100 milliards de neurones, qu’il utilise sélectivement dans différents hémisphères du cerveau pour accomplir diverses tâches ou réflexions. »

Ainsi, ils développent des algorithmes qui contournent les calculs redondants inutiles et n’entrent pas automatiquement en mode haute performance.

Dans d’autres cas, la recherche s’est inspirée de la neuromodulation du cerveau et a créé un algorithme appelé « système de stockage » pour réduire l’énergie de 37 % sans aucune dégradation de précision, la fonction d’auto‑réparation des cellules cérébrales appelée astrocytes pour les dispositifs matériels, et l’obtention d’une forme de calcul neuromorphique (inspirée du cerveau) (memristors) pour travailler ensemble dans plusieurs sous‑groupes de réseaux neuronaux.

Investir dans l’intelligence artificielle

Une entreprise mondiale de semi‑conducteurs, AMD (AMD ) est reconnue pour ses technologies de calcul haute performance, de graphisme et de visualisation. En concurrence directe avec le favori de l’IA NVIDIA (NVDA ), elle gagne rapidement du terrain sur les marchés des centres de données et des accélérateurs IA. Sa série MI300 cible spécifiquement les charges de travail d’IA de nouvelle génération et les applications HPC.

Sa présence dominante dans le domaine des CPU pour centres de données, son fort accent sur la R&D, sa croissance de chiffre d’affaires, sa clientèle et ses acquisitions font d’AMD un acteur majeur du secteur.

Advanced Micro Devices (AMD )

En 2022, AMD a conclu un accord record dans l’industrie des puces d’une valeur de 50 milliards de dollars avec l’acquisition de Xilinx, devenant ainsi le leader du calcul haute performance et adaptatif. Plus récemment, elle a finalisé l’acquisition de ZT Systems pour saisir l’opportunité de 500 milliards de dollars d’accélérateurs IA pour centres de données d’ici 2028.

La performance du marché d’AMD se redresse également cette année après avoir été affectée par les turbulences tarifaires. Au moment de la rédaction, les actions d’AMD s’échangent à 120 $, en baisse de 6,9 % depuis le début de l’année mais seulement d’environ 47 % par rapport à son pic de mars 2024. Ainsi, sa capitalisation boursière s’élève à 182,34 milliards de dollars avec un BPA (TTM) de 1,36 et un PER (TTM) de 82,44.

En ce qui concerne les finances de l’entreprise, AMD a annoncé une hausse de 36 % d’une année sur l’autre de son chiffre d’affaires, atteignant 7,4 milliards de dollars pour le premier trimestre 2025, ce que la PDG Dr. Lisa Su a qualifié de « début exceptionnel » pour l’année, « malgré le contexte macroéconomique et réglementaire dynamique ». Cette croissance a été stimulée par « l’expansion du centre de données et l’élan de l’IA », a-t-elle ajouté.

Au cours de cette période, le revenu d’exploitation d’AMD s’élevait à 806 millions de dollars, le bénéfice net à 709 millions de dollars, et le bénéfice net dilué par action à 0,44 $. Pour le deuxième trimestre 2025, elle prévoit environ 7,4 milliards de dollars de chiffre d’affaires. 

Parmi les développements clés de l’entreprise figurent l’expansion de partenariats stratégiques avec Meta Platforms, Inc. (META ) (Llama), Alphabet Inc. (GOOGL ) (Gemma), Oracle Corporation (ORCL ), Core42, Dell Technologies (DELL ), et d’autres. AMD, avec Nokia, Cisco Systems, Inc. (CSCO ), et Jio, ont également annoncé une nouvelle plateforme Open Telecom AI pour offrir des solutions pilotées par l’IA afin d’améliorer l’efficacité, la sécurité et les capacités.

Cette semaine, AMD et Nvidia se sont associés à Humain, une filiale axée sur l’IA du Fonds d’investissement public d’Arabie Saoudite, pour fournir des semi‑conducteurs à un projet de centre de données à grande échelle qui devrait avoir une capacité de 500 MW.

Cliquez ici pour obtenir une liste des principales entreprises informatiques non‑silicium.

Dernières tendances et développements d’Advanced Micro Devices (AMD)

Conclusion

Au cours des dernières années, la frénésie autour de l’IA a connu une croissance explosive, et pour de bonnes raisons. Cette technologie, après tout, possède un grand potentiel pour transformer un large éventail d’industries, de la santé, la fabrication et la science des matériaux à la finance, le divertissement, l’éducation, le commerce de détail et la cybersécurité.

Cependant, les avancées technologiques, l’adoption croissante et l’expansion subséquente de ces LLM ont entraîné une demande énergétique importante, qui contribue aux émissions de gaz à effet de serre (GES) et au changement climatique, augmente les coûts économiques et affecte la durabilité de la technologie.

Cela représente un défi majeur pour l’IA. Si nous voulons exploiter pleinement son véritable potentiel en termes de réduction des coûts, d’augmentation de la productivité et d’amélioration de la prise de décision à grande échelle, les modèles doivent atteindre rentabilité et durabilité.

La bonne nouvelle, cependant, est que des chercheurs du monde entier travaillent déjà d’arrache‑pied à rendre l’IA économe en énergie, comme le montre la puce alimentée par l’IA de l’Université d’État de l’Oregon, ce qui suggère une forte possibilité d’aligner l’innovation avec la durabilité.

Bien sûr, les technologies proposées doivent surmonter leur principal obstacle pour obtenir un impact réel, à savoir l’évolutivité. Néanmoins, une chose est claire : l’avenir d’une IA plus verte est réalisable, et il arrive !

Cliquez ici pour tout savoir sur l’investissement dans l’intelligence artificielle.

Études référencées:

1. Yu, H., Huang, Z., Lamon, S., Wu, J., Zhao, Z., Lin, D., Zhao, H., Zhang, J., Lu, C., Liu, H., Zhang, X., & Zhang, C. (2025). Transport d’images tout‑optique à travers une fibre multimode à l’aide d’un réseau neuronal diffractif miniaturisé sur la facette distale. Nature Photonics, 19, 486–493. https://doi.org/10.1038/s41566-025-01621-4
2. Bandyopadhyay, S., Sludds, A., Krastanov, S., Youssry, A., Zhang, L., Lian, C., Yu, S., Desiatov, B., Burek, M. J., Lukin, M. D., & Lončar, M. (2024). Réseau neuronal profond photonique monocoque avec entraînement unidirectionnel. Nature Photonics, 18, 1335–1343. https://doi.org/10.1038/s41566-024-01567-z
3. Lv, Y., Zink, B. R., Bloom, R. P., Roy, A., Vaddi, K., Shang, L., & Manipatruni, S. (2024). Démonstration expérimentale d’une mémoire à accès aléatoire computationnelle basée sur des jonctions tunnel magnétiques. npj Unconventional Computing, 1, 3. https://doi.org/10.1038/s44335-024-00003-3

Gaurav a commencé à trader des cryptomonnaies en 2017 et est tombé amoureux de l'espace crypto depuis. Son intérêt pour tout ce qui concerne les cryptomonnaies l'a transformé en écrivain spécialisé dans les cryptomonnaies et la blockchain. Bientôt, il s'est retrouvé travaillant avec des entreprises de cryptomonnaies et des médias. Il est également un grand fan de Batman.