Intelligence artificielle

Pour que l’IA réalise son potentiel, les exigences énergétiques doivent être prises en compte

Publié le 12 août 2024

Mis à jour le 1 juin 2026

Par

David Hamilton

Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.

L’intelligence artificielle (IA) continue d’alimenter la quatrième révolution industrielle, parallèlement à ses exigences énergétiques. Aujourd’hui, chacun peut accéder à des outils d’IA avancés et les intégrer à ses systèmes pour améliorer l’efficacité et réduire la charge de travail. L’énergie nécessaire pour alimenter ces algorithmes augmente à mesure que la demande d’applications d’IA augmente. Ainsi, les environnementalistes soulignent déjà les problèmes de durabilité liés à cette technologie. Heureusement, une équipe de chercheurs a créé une alternative hautement efficace. Voici ce que vous devez savoir.

Croissance des exigences énergétiques de l’IA créant une crise énergétique

Les nouveaux systèmes d’IA continuent d’être lancés à une fréquence croissante. La prévision la plus récente de l’utilisation mondiale de l’énergie prévoit que la consommation énergétique de l’IA doublera, passant de 460 térawattheures (TWh) en 2022 à 1 000 TWh d’ici 2026. Ces protocoles comprennent les systèmes de recommandation, les grands modèles de langage (LLM), le traitement et la création d’images et de vidéos, les services Web3, et plus encore.

Selon l’étude du chercheur, les systèmes d’IA nécessitent un transfert de données équivalant à « 200 fois l’énergie utilisée pour le calcul lors de la lecture de trois opérandes source de 64 bits et de l’écriture d’un opérande destination de 64 bits dans une mémoire principale hors puce. » Ainsi, réduire la consommation d’énergie pour les applications informatiques d’intelligence artificielle (IA) est une préoccupation majeure pour les développeurs qui devront surmonter cet obstacle afin d’atteindre une adoption à grande échelle et faire mûrir la technologie.

Heureusement, un groupe d’ingénieurs innovants de l’Université du Minnesota s’est mobilisé avec une solution possible qui pourrait réduire la consommation d’énergie des protocoles d’IA de plusieurs ordres de grandeur. Pour accomplir cette tâche, les chercheurs présentent une nouvelle conception de puce qui améliore l’architecture de Von Neumann présente dans la plupart des puces aujourd’hui.

Architecture de Von Neumann

John von Neumann a révolutionné le secteur informatique en 1945 lorsqu’il a séparé les unités logiques et mémoires, permettant une informatique plus efficace à l’époque. Dans cette configuration, la logique et les données sont stockées à des emplacements physiques différents. Son invention a amélioré les performances car elle permettait d’accéder aux deux simultanément.

Source – Université du Minnesota Twin Cities

RAM

Aujourd’hui, la plupart des ordinateurs utilisent encore la structure de Von Neumann avec votre disque dur stockant vos programmes et la mémoire à accès aléatoire (RAM) contenant les instructions de programmation et les données temporaires. La RAM actuelle accomplit cette tâche en utilisant diverses méthodes, notamment la DRAM, qui utilise des condensateurs, et la SRAM, qui comporte plusieurs circuits.
Il est notable que cette structure a très bien fonctionné pendant des décennies. Cependant, le transfert constant de données entre la logique et la mémoire nécessite beaucoup d’énergie. Ce transfert d’énergie augmente à mesure que les exigences de données et la charge de calcul augmentent. Ainsi, cela crée un goulot d’étranglement de performance qui limite l’efficacité à mesure que la puissance de calcul augmente.

Tentatives d’amélioration des exigences énergétiques

Au fil des ans, de nombreuses tentatives ont été faites pour améliorer l’architecture de Von Neumann. Ces tentatives ont créé différentes variantes du processus mémoire dans le but de rapprocher physiquement les deux actions. Actuellement, les trois principales variantes comprennent.

Traitement proche de la mémoire

Cette mise à niveau rapproche physiquement la logique de la mémoire. Cela a été réalisé à l’aide d’une infrastructure empilée en 3D. Rapprocher la logique a réduit la distance et l’énergie nécessaires pour transférer les données requises pour alimenter les calculs. Cette architecture a offert une efficacité améliorée.

Calcul en mémoire

Une autre méthode actuelle d’amélioration de l’architecture informatique est le calcul en mémoire. Notamment, il existe deux variantes de ce type de puce. L’original intègre des grappes de logique à côté de la mémoire sur une seule puce. Cette mise en œuvre permet d’éliminer les transistors utilisés dans les versions précédentes. Cependant, beaucoup considèrent que cette méthode n’est pas « véritable » pour la structure en mémoire car elle possède encore des emplacements mémoire séparés, ce qui signifie que les problèmes de performance initiaux résultant du transfert de données subsistent, bien qu’à une échelle moindre.

Vrai en mémoire

Le dernier type d’architecture de puce est le « vrai en mémoire ». Pour être qualifiée de ce type d’architecture, la mémoire doit effectuer les calculs directement. Cette structure améliore les capacités et les performances car les données pour les opérations logiques restent à leur emplacement. La dernière version de l’architecture vraie en mémoire du chercheur est le CRAM.

(CRAM)

La mémoire à accès aléatoire computationnelle (CRAM) permet de véritables calculs en mémoire puisque les données sont traitées au sein du même tableau. Les chercheurs ont modifié une architecture standard 1T1M STT-MRAM pour rendre le CRAM possible. La disposition du CRAM intègre des microtransistors dans chaque cellule et s’appuie sur des CPU basés sur des jonctions tunnel magnétiques.
Cette approche offre un meilleur contrôle et des performances accrues. L’équipe a ensuite empilé un transistor supplémentaire, une ligne logique (LL) et une ligne de bits logique (LBL) dans chaque cellule, permettant un calcul en temps réel au sein du même banc de mémoire.

Histoire du CRAM

Les systèmes d’IA actuels nécessitent une nouvelle structure capable de répondre à leurs exigences computationnelles sans compromettre les préoccupations de durabilité. Reconnaissant cette demande, les ingénieurs ont décidé d’explorer en profondeur les capacités du CRAM pour la première fois. Leurs résultats ont été publiés dans la revue scientifique NPJ sous le rapport « Démonstration expérimentale de la mémoire à accès aléatoire computationnelle basée sur des jonctions tunnel magnétiques. »
Le premier CRAM a exploité une structure d’appareil MTJ. Ces dispositifs spintroniques ont amélioré les méthodes de stockage précédentes en utilisant le spin des électrons plutôt que des transistors pour transférer et stocker les données via la méthode MTJ. Cette méthode utilise une fine barrière de tunnel située entre deux couches ferromagnétiques (FM). Une petite tension excite ces électrons et les fait transférer entre les couches.
Ce transfert crée un courant. Il offre également un moyen efficace de lire et d’écrire la mémoire. La dernière mise à jour du CRAM pousse ce concept plus loin, offrant des résultats haute performance tout en réduisant les exigences énergétiques.

Étude du CRAM

Le concept CRAM est en cours de développement depuis des années. Cependant, il n’y a pas eu beaucoup de tests approfondis de ses capacités jusqu’à présent. Notamment, l’étude a exploité une variété de concepts brevetés développés par l’équipe et ses prédécesseurs. Par exemple, la mémoire magnétique à accès aléatoire (MRAM), qui est un composant essentiel des montres intelligentes, capteurs et microcontrôleurs d’aujourd’hui, a été utilisée avec des dispositifs MTJ modifiés pour améliorer les performances.

Tests du CRAM

La phase de test a nécessité que les chercheurs mesurent les performances des puces lors de l’exécution logique. Les chercheurs ont employé diverses stratégies pour obtenir les informations les plus approfondies possibles, incluant l’addition scalaire, la multiplication et la multiplication matricielle.
La première étape du processus consistait à mesurer l’activité lors d’opérations mémoire de base. À partir de là, l’équipe a intensifié le calcul en utilisant des opérations logiques à 2, 3 et 5 entrées. Après cette étape, un additionneur complet de 1 bit avec deux conceptions différentes a été introduit et retesté. Le test final a inclus un tableau 1 × 7, qui a donné des résultats intéressants.

Les résultats des tests du CRAM montrent des exigences énergétiques plus faibles

Les résultats des tests ont démontré l’efficacité du nouveau processus de preuve de concept comparé aux modèles actuels. Les données ont montré une consommation d’énergie moyenne 1000 fois inférieure pendant le calcul. Lorsqu’il est combiné à d’autres méthodes d’économie d’énergie, l’approche a démontré des économies d’énergie de 2 500 et 1 700 fois moins par rapport aux méthodes traditionnelles.

Fonctionnalités supplémentaires

Une autre découverte intéressante est que le CRAM permet l’accès aléatoire simultané aux données et aux opérandes. Cet avantage améliore considérablement les capacités de calcul parallèle, ce qui peut conduire à des protocoles plus sécurisés et stables à l’avenir.

Avantages que le CRAM apporte au marché

Examiner les avantages que le CRAM apporte aidera à mieux comprendre pourquoi il s’agit d’une percée révolutionnaire qui pourrait avoir un effet immédiat sur les activités quotidiennes de la personne moyenne. Le CRAM permet aux développeurs et aux fabricants de créer du matériel parfaitement configuré pour sa tâche principale, réduisant les exigences énergétiques et améliorant les performances.

IA – Focus

L’intelligence artificielle change déjà tellement de choses. Ces systèmes sont très demandés mais nécessitent du matériel et des logiciels spécifiques pour fonctionner correctement. Le CRAM offre aux fabricants la capacité de créer du matériel dès le premier jour, conçu pour prendre en charge des applications gourmandes en données, centrées sur la mémoire ou sensibles à la consommation d’énergie.
À l’avenir, le CRAM alimentera des algorithmes d’IA avancés tels que la bioinformatique, le traitement du signal, les réseaux neuronaux, l’informatique en périphérie et le matériel militaire le plus avancé. Le tableau CRAM permettra aux développeurs de créer des applications d’apprentissage automatique plus performantes, suffisamment flexibles pour répondre aux besoins de la communauté.

Utilise une structure éprouvée

Un autre avantage majeur qui fait du CRAM une option intelligente est l’utilisation de systèmes matériels éprouvés. Notamment, le CRAM utilise une technologie courante et mature, ce qui renforce la confiance des consommateurs. Cela garantit également que les problèmes matériels sont une préoccupation minimale pour les utilisateurs.

Flexible

Le CRAM offre une véritable flexibilité aux développeurs. Les programmeurs peuvent calculer des données n’importe où dans le tableau mémoire en utilisant une variété d’opérations logiques populaires. Concrètement, le CRAM prend en charge AND, OR, NAND, NOR et MAJ, ce qui augmente sa polyvalence.

Plus rapide

La vitesse est un autre avantage qui ne peut être négligé. Le transfert de données entre la logique et les emplacements de stockage mémoire prend du temps. Bien que ce temps ne représente qu’une fraction de seconde, il peut s’accumuler et entraîner une expérience utilisateur diminuée. Le CRAM élimine le besoin de transferts de données lents et énergivores en faisant de la même mémoire la responsable de ces tâches.

Parallélisme

Le parallélisme est la capacité d’exécuter le même code en parallèle simultanément. C’est un composant essentiel de nombreuses opérations de fabrication, de sécurité et industrielles. Grâce à la structure du CRAM, il peut exécuter la même logique en parallèle sur le même tableau mémoire simultanément.

Coûts de fabrication

Le CRAM réduira également les coûts de fabrication des appareils haut de gamme en diminuant le nombre de pièces nécessaires à la construction d’un produit. Le CRAM utilise la même mémoire pour la logique et les données, ce qui signifie que les fabricants peuvent créer des puces avec moins de composants. Cette structure réduit les coûts et améliore la fiabilité et les performances.

Chercheurs

Cette recherche a été dirigée par Tema de l’Université du Minnesota. Les chercheurs principaux comprenaient Jian-Ping Wang, professeur McKnight, et Robert F. Hartmann. De plus, Ulya Karpuzcu, Robert Bloom, Husrev Cilasun, Robert et Marjorie Henle, Sachin Sapatnekar, Brandon Zink, Zamshed Chowdhury et Salonik Resch ont joué des rôles essentiels dans l’étude. Une équipe de l’Université d’Arizona a également apporté son aide, incluant Pravin Khanal, Ali Habiboglu et le professeur Weigang Wang.
La recherche a été rendue possible grâce à des subventions de la Defense Advanced Research Projects Agency (DARPA) des États‑Unis, du National Institute of Standards and Technology (NIST), du National Science Foundation (NSF) et de Cisco Inc. Le projet a également mené des tests et des études au Minnesota Nano Center et au Minnesota Supercomputing Institute de l’Université du Minnesota.

Deux entreprises qui pourraient bénéficier de la réduction des exigences énergétiques de l’IA

De nombreux fabricants pourraient obtenir des revenus supplémentaires ou améliorer leur gamme de produits simplement en intégrant des options CRAM. Ces entreprises occupent des positions fortes sur le marché et ont la capacité d’intégrer de nouvelles technologies de manière à améliorer considérablement leurs offres.

Microsoft

(MSFT )

Microsoft est un acteur majeur des marchés de l’IA et de l’informatique. L’entreprise reste un pionnier du secteur et contribue de façon importante à la technologie depuis plus d’une décennie. Aujourd’hui, Microsoft détient une part importante du secteur de l’IA et cherche à rester un concurrent viable à l’avenir.
Les services d’IA de Microsoft ont un avantage majeur sur leurs concurrents du fait qu’ils restent le principal système d’exploitation utilisé à l’échelle mondiale. Ainsi, les systèmes d’IA de Microsoft bénéficient d’un vaste public d’utilisateurs et de données accessibles. Ces données ont aidé Microsoft à créer de puissants nouveaux algorithmes d’IA qui, un jour, constitueront le cœur des derniers systèmes d’exploitation Windows.

Arm Holdings

(ARM )

Arm Holdings est entré sur le marché en 1990. Il a été fondé par Sophie Wilson et Steve Furber. À l’origine, l’entreprise s’appelait Advanced RISC Machines (ARM) Ltd. avant de changer de nom pour Arm Holdings en 1998. Au début des années 2000, Arm Holdings s’est forgé une réputation de fabricant de qualité proposant des GPU et d’autres produits sur le marché.
Aujourd’hui, elle reste un fournisseur de propriété intellectuelle et un fabricant de semi-conducteurs de premier plan. L’entreprise a été rachetée en 2016 par SoftBank pour 32 milliards de dollars et a connu une croissance considérable depuis. Le fabricant pourrait réduire considérablement son empreinte environnementale tout en améliorant les performances et les revenus en intégrant le CRAM à ses offres actuelles.

L’avenir de l’IA dépendra de ses exigences énergétiques

Le principal facteur limitant l’adoption de l’IA est ses exigences énergétiques. Ces exigences obligent les gens à penser différemment pour créer des solutions aux goulets d’étranglement qui limitent les performances. Cette dernière étude ouvre la voie à un avenir plus prometteur où les services d’IA accéderont à des solutions à faible consommation d’énergie qui autonomiseront l’ensemble de la communauté.

Découvrez d’autres projets d’intelligence artificielle maintenant.