Science des matériaux
Établir des normes pour maximiser les avantages de l’intelligence artificielle

La science des matériaux évolue rapidement avec l’essor de l’intelligence artificielle (IA) et de l’apprentissage automatique (ML). Ces outils transforment la façon dont nous découvrons, concevons et optimisons de nouveaux matériaux pour relever les grands défis dans l’énergie propre et la fabrication durable, l’électronique avancée et la biomédecine.
Cependant, tirer le meilleur parti de l’IA dans la recherche sur les matériaux nécessite plus que de simples algorithmes sophistiqués et de grandes quantités de données. Il faut une infrastructure robuste et normalisée pour accéder, partager et intégrer les données sur les matériaux provenant de sources et de domaines différents. Sans normes, les chercheurs font face à d’importantes barrières pour entraîner des modèles précis et généralisables et pour transférer leurs résultats dans le monde réel.
Ici, nous examinerons l’importance des normes de données pour la découverte de matériaux guidée par l’IA, en nous concentrant sur la nouvelle Intégration de Bases de Données Ouvertes pour la Conception de Matériaux (OPTIMADE). Nous couvrirons les défis de l’échange de données sur les matériaux, les fonctionnalités et les avantages de l’API OPTIMADE, ainsi que des exemples concrets de la façon dont cette norme change déjà la recherche sur les matériaux. Enfin, nous envisagerons l’avenir d’OPTIMADE et ce que cela pourrait signifier pour l’innovation dans les nouveaux matériaux.

Les défis de l’échange de données sur les matériaux
Pour comprendre l’importance des normes de données en science des matériaux, il faut saisir les défis auxquels les chercheurs sont confrontés pour accéder et intégrer des données provenant de sources différentes.
Les données sur les matériaux sont dispersées à travers un paysage fragmenté de bases de données, chacune avec son propre schéma de données, API et protocoles d’accès. Ce manque d’interopérabilité constitue une grande barrière pour les chercheurs qui souhaitent construire des modèles d’apprentissage automatique ou réaliser des fouilles de données à grande échelle.
Prenons, par exemple, un scientifique des matériaux qui veut découvrir de nouveaux matériaux pour batteries. Pour entraîner un modèle prédictif, il aurait besoin de rassembler des données sur un large éventail de composés de batterie connus, leurs structures cristallines, leurs propriétés électrochimiques et leurs conditions de synthèse.
Cependant, ces données sont probablement réparties sur plusieurs bases de données, chacune avec sa propre façon de représenter et de fournir l’information.
Pour obtenir les données pertinentes, le chercheur devrait:
- Écrire du code personnalisé pour interroger l’API de chaque base de données
- Naviguer dans leurs schémas uniques
- Nettoyer et fusionner les résultats dans un format cohérent.
Cela est chronophage, sujet aux erreurs, et nécessite une expertise technique en dehors du domaine principal du chercheur.
Dr Julia Ling, scientifique en informatiques des matériaux au Lawrence Berkeley National Laboratory, a vécu cela de première main. Elle déclare:
« Dans mon travail, j’ai souvent besoin d’intégrer des données provenant de plusieurs bases de données pour constituer des ensembles d’entraînement complets pour mes modèles d’apprentissage automatique. Mais le manque de normalisation entre ces bases de données est un gros problème. Je peux passer des semaines à écrire des scripts de traitement des données avant même de pouvoir commencer à entraîner mes modèles. »
Le problème est aggravé par le fait que de nombreuses bases de données de matériaux sont enfermées dans des groupes de recherche ou des institutions individuelles, de sorte que les chercheurs externes ne peuvent même pas les trouver, encore moins accéder à des données potentiellement précieuses. Ce manque de visibilité et d’accessibilité freine la science et engendre des duplications inutiles d’efforts.
Dr Bryce Meredig, cofondateur et directeur scientifique de Citrine Informatics, affirme:
« L’état actuel des données sur les matériaux est un chaos. Elles sont dispersées, hétérogènes et souvent mal documentées. Cela rend impossible une utilisation efficace de ces données, surtout pour l’apprentissage automatique. »
Le besoin de normes communautaires
Pour surmonter ces défis et exploiter pleinement l’IA dans la recherche sur les matériaux, la communauté a besoin d’un ensemble commun de normes et de protocoles d’échange de données. Ces normes devraient permettre aux chercheurs d’accéder et d’intégrer des données provenant de sources différentes dans un format cohérent, lisible par machine, sans devoir naviguer dans les complexités propres à chaque base de données.
Ces normes doivent être développées et adoptées par la communauté de manière ouverte et collaborative. Elles ne peuvent pas être imposées d’en haut par une institution ou un fournisseur de base de données unique. Elles doivent émerger d’un processus de consensus et d’itération avec la contribution d’un large éventail de parties prenantes issues du milieu académique, de l’industrie et du gouvernement.
Les avantages sont clairs. En fournissant un langage et un cadre communs pour l’échange de données sur les matériaux, on peut réduire les barrières à l’accès et à l’intégration des données, permettant aux chercheurs de passer plus de temps à la science et moins au nettoyage des données. De plus, cela peut favoriser un riche écosystème d’outils et de services interopérables, allant des plateformes de visualisation et d’analyse de données aux pipelines de découverte automatisés et aux bases de connaissances.
Dr Kristin Persson, directrice du Materials Project au Lawrence Berkeley National Laboratory, affirme que les normes communautaires sont essentielles pour exploiter pleinement l’IA en science des matériaux. Elle ajoute:
“En convenant d’un ensemble commun de principes et de protocoles d’échange de données, nous pouvons ouvrir un tout nouveau niveau de collaboration et d’innovation dans la recherche sur les matériaux. Il ne s’agit pas seulement de rendre les données plus accessibles, mais de permettre une nouvelle science qui était impossible auparavant.”
L’essor d’OPTIMADE
Constatant le besoin de normes communautaires pour l’échange de données sur les matériaux, un groupe de bases de données et de fournisseurs de logiciels leaders s’est réuni en 2016 pour lancer l’initiative Open Databases Integration for Materials Design (OPTIMADE).
L’objectif d’OPTIMADE est de développer une spécification d’API commune pour interroger et récupérer des données depuis les bases de données de matériaux dans un format standardisé, lisible par machine. En offrant une interface unique à de nombreuses bases de données, OPTIMADE facilitera l’accès et l’intégration des données de matériaux dans les flux de travail des chercheurs, quel que soit le logiciel ou la base de données utilisés.
La spécification OPTIMADE repose sur une conception web RESTful utilisant les protocoles HTTP standard et les formats de données JSON afin de permettre la communication entre bases de données et applications clientes. Elle définit un ensemble de points d’accès et de paramètres de requête communs que les bases de données peuvent implémenter pour exposer leurs données de manière standardisée et auto-descriptive.
Par exemple, une application cliente peut envoyer une simple requête HTTP GET à une base de données compatible OPTIMADE avec les paramètres de requête dans un format standardisé pour rechercher des matériaux contenant du fer et de l’oxygène.
Le serveur de la base de données traduit alors cela dans son propre langage de requête, exécute la recherche et renvoie les résultats en JSON. L’application cliente peut ensuite analyser et traiter ces résultats à l’aide d’outils et de bibliothèques standards sans connaître le schéma ou les détails d’implémentation de la base de données sous-jacente.
OPTIMADE en action
Depuis 2019, OPTIMADE a été adopté par de nombreuses bases de données de matériaux et outils logiciels.
Un exemple est le Materials Project, une base de données populaire de propriétés de matériaux calculées hébergée par le Lawrence Berkeley National Laboratory. En 2020, l’équipe du Materials Project a implémenté une API OPTIMADE afin que les utilisateurs puissent accéder à son vaste jeu de données en utilisant des paramètres de requête et des formats de réponse standardisés.
Selon le Dr Shyam Dwaraknath, architecte principal de la base de données:
« L’API OPTIMADE du Materials Project a changé la donne pour nos utilisateurs. Elle a permis l’émergence d’un tout nouvel écosystème d’outils et d’intégrations qui facilitent plus que jamais l’accès et l’analyse de nos données depuis les notebooks Jupyter et les applications web jusqu’aux pipelines de criblage à haut débit. »
NOMAD Archive, un référentiel de données brutes issues de simulations de matériaux à haut débit, est un autre adoptant précoce d’OPTIMADE. En exposant ses données via une API OPTIMADE, NOMAD a permis aux chercheurs de réaliser des fouilles de données à grande échelle et d’entraîner des modèles d’apprentissage automatique sur un immense jeu de propriétés calculées.
Selon le Dr Luca Ghiringhelli, chef de groupe à l’Institut Fritz Haber et passionné d’IA en science des matériaux:
« Nous constatons un véritable engouement pour la recherche de matériaux guidée par les données, et OPTIMADE joue un rôle clé dans cela. En offrant une interface unique à plusieurs bases de données, elle réduit les barrières à l’accès et à l’intégration des données et contribue à démocratiser le domaine. »
Applications concrètes
L’impact d’OPTIMADE se fait déjà voir dans de nombreux domaines de recherche sur les matériaux, des batteries et des énergies renouvelables à l’aérospatiale et à l’ingénierie biomédicale. Voici quelques exemples de son utilisation:
#1. Recherche de thermoelectriques haute performance: Des chercheurs de l’Université Northwestern ont utilisé OPTIMADE pour combiner des données provenant de plusieurs bases de données computationnelles, dont le Materials Project et OQMD, afin d’entraîner un modèle d’apprentissage automatique prédisant les propriétés thermoelectriques de nouveaux matériaux. Grâce à cet ensemble de données, ils ont pu identifier plusieurs nouveaux composés avec des performances potentiellement record, qui sont maintenant synthétisés et testés.
#2. Criblage à haut débit de matériaux 2D: Une équipe de l’Université technique du Danemark a utilisé OPTIMADE pour examiner plus de 50 000 matériaux 2D calculés provenant de la Computational 2D Materials Database (C2DB). En interrogeant la base de données avec des filtres OPTIMADE, ils ont rapidement trouvé des matériaux présentant des propriétés spécifiques, telles qu’une haute mobilité des porteurs ou une faible bande interdite, pour les électroniques et optoélectroniques de prochaine génération.
#3. Développement rapide de nouveaux matériaux de batterie: Des chercheurs du MIT et de l’Université Stanford ont utilisé OPTIMADE pour créer une base de données centralisée des propriétés des matériaux de batterie, combinant des données du Materials Project, d’OQMD et d’autres sources. Ils ont entraîné une série de modèles d’apprentissage automatique sur cet ensemble de données afin de prédire des indicateurs clés de performance, tels que la capacité et la cyclabilité, pour de nouvelles chimies de batteries lithium‑ion. Ces modèles guident désormais les efforts expérimentaux visant à développer des batteries plus sûres, plus durables et plus énergétiques pour les véhicules électriques et le stockage sur le réseau.
#4. Conception d’alliages à haute entropie: Une équipe de l’Université du Maryland a utilisé OPTIMADE pour combiner des données provenant de plusieurs bases de données computationnelles et expérimentales, dont le Materials Project, OQMD et la High‑Entropy Alloys Database (THEAD), afin de constituer un jeu de données sur les propriétés des alliages à haute entropie. Ils ont entraîné un modèle d’apprentissage automatique pour prédire les énergies de formation et la stabilité de phase de nouvelles compositions d’alliages à haute entropie. Ils ont pu criblé des milliers de candidats et identifier les plus prometteurs pour une validation expérimentale. Ce travail accélère le développement d’alliages à haute entropie de prochaine génération, offrant une résistance, une ténacité et une résistance à la corrosion exceptionnelles pour l’aérospatiale, la défense et au-delà.
Passons maintenant aux entreprises qui pourraient le plus bénéficier de l’établissement de ces normes.
#1. Tesla (TSLA)
Tesla, Inc. tirera grandement profit de l’échange de données standardisé d’OPTIMADE, qui renforcera sa capacité à développer de meilleures technologies de batteries et à optimiser les matériaux dans ses processus de fabrication. Cela aidera Tesla à créer des batteries avec une densité énergétique plus élevée, des cycles de vie plus longs et des caractéristiques de sécurité améliorées, tout en réduisant les coûts et en améliorant la durabilité.
(TSLA )
Sur le plan financier, en 2023, Tesla a déclaré un chiffre d’affaires de 96,8 milliards de dollars, soit une hausse de 19 % par rapport à l’année précédente, démontrant une forte croissance financière et un potentiel d’innovation continue.
#2. Intel Corporation (INTC)
Une autre entreprise qui bénéficiera considérablement de l’échange de données standardisé d’OPTIMADE est Intel Corporation (INTC), leader dans les secteurs technologique et des semi-conducteurs. En exploitant l’IA et les données de matériaux normalisées, Intel peut découvrir et concevoir de nouveaux matériaux semi-conducteurs, conduisant au développement de puces aux performances supérieures, à une plus grande efficacité et à de nouvelles fonctionnalités.
Cela aidera Intel à maintenir sa position à la pointe de l’innovation en semi-conducteurs. De plus, l’intégration de données provenant de diverses bases de données rationalisera les processus de recherche et développement d’Intel, permettant de se concentrer davantage sur l’innovation et moins sur la gestion des données.
(INTC )
Sur le plan financier, Intel a déclaré un chiffre d’affaires de 54,2 milliards de dollars en 2023, reflétant le rôle important de l’entreprise dans l’industrie et son potentiel continu de croissance et de développement.
L’avenir d’OPTIMADE
Alors qu’OPTIMADE est de plus en plus adoptée, la communauté de la science des matériaux explore de nouveaux horizons d’intégration et de découverte de données. Un domaine de développement est l’intégration d’OPTIMADE avec d’autres normes de données et ontologies, telles que l’European Materials Modelling Ontology (EMMO) et le Crystallographic Information Framework (CIF).
L’alignement de ces différentes normes et sémantiques permettra aux chercheurs de poser des questions encore plus puissantes et complexes à travers de multiples sources de données, longueurs, échelles de temps, et domaines de la science des matériaux.
Un autre axe de recherche futur porte sur le développement d’outils plus avancés et automatisés pour l’analyse des données de matériaux et l’apprentissage automatique. L’essor des techniques d’apprentissage profond telles que les réseaux de neurones graphiques et les architectures de transformeurs indique le besoin de méthodes standardisées et évolutives pour représenter et traiter les données de matériaux dans ces modèles.
OPTIMADE est bien placé pour jouer un rôle clé dans cet espace, car il peut fournir une interface commune pour accéder et intégrer de grands ensembles de données diversifiées de propriétés et de structures de matériaux. Comme le dit le Dr Matthias Scheffler, directeur de l’Institut Fritz Haber et pionnier de la science computationnelle des matériaux:
« OPTIMADE ne se contente pas de rendre les données plus accessibles, il permet de nouveaux paradigmes pour la découverte et la conception de matériaux. En fournissant une base pour la recherche de matériaux guidée par les données et l’IA, nous contribuons à inaugurer une nouvelle ère d’innovation et de découverte. »
En regardant plus loin, il existe également un intérêt pour l’utilisation d’OPTIMADE afin de permettre des modèles de partage de données et de découverte de matériaux plus décentralisés et collaboratifs. Par exemple, certains chercheurs explorent l’utilisation de la blockchain pour créer des réseaux sécurisés et distribués de bases de données OPTIMADE où les données peuvent être partagées et interrogées à travers plusieurs institutions et domaines.
D’autres s’intéressent à l’apprentissage fédéré pour entraîner des modèles d’apprentissage automatique sur des ensembles de données décentralisés sans avoir besoin de centraliser ou d’harmoniser les données. En permettant aux chercheurs de sociétés comme Matgenix et Data Science OÜ de collaborer et de partager des insights au‑delà des frontières institutionnelles tout en conservant le contrôle de leurs propres données et de leur propriété intellectuelle, ces approches pourraient accélérer le rythme de la découverte et de l’innovation en matière de matériaux.
Réflexions finales
L’IA et les techniques guidées par les données en science des matériaux transforment la façon dont nous découvrons, concevons et déployons de nouveaux matériaux. Mais pour réaliser pleinement ces approches, nous avons besoin d’une infrastructure robuste et normalisée pour accéder et intégrer les données provenant de multiples sources et domaines.
L’API OPTIMADE est un facteur clé qui permet cela en offrant un langage et un protocole communs pour interroger et récupérer des données de matériaux dans un format lisible par machine. En réduisant les barrières à l’accès et à l’intégration des données, OPTIMADE rend la recherche sur les matériaux plus démocratique et accélère l’innovation.
À mesure qu’OPTIMADE est de plus en plus adoptée et que de nouveaux outils et techniques pour la découverte de matériaux guidée par les données émergent, nous pouvons nous attendre à encore plus d’avancées à l’avenir. Des nouveaux matériaux de batterie et alliages haute performance aux médicaments personnalisés et nanomatériaux fonctionnels, les possibilités sont infinies.
Mais pour concrétiser cela, nous avons besoin d’investissements soutenus et d’une collaboration à travers la communauté de la science des matériaux, ainsi que de données ouvertes, de normes ouvertes et de science ouverte. Ce n’est qu’en travaillant ensemble au‑delà des frontières disciplinaires et institutionnelles que nous pourrons libérer tout le potentiel de l’IA et de la découverte guidée par les données en science des matériaux.
Comme le dit le Dr Gerbrand Ceder, professeur de science des matériaux à l’UC Berkeley et pionnier de la conception computationnelle de matériaux:
« L’avenir est prometteur, mais nous devons changer notre façon de penser les données et la collaboration. En utilisant des normes ouvertes comme OPTIMADE et en travaillant ensemble en tant que communauté pour partager les connaissances, nous pouvons accélérer l’innovation et résoudre certains des plus grands problèmes auxquels nous sommes confrontés aujourd’hui. »
Dans l’ensemble, l’adoption de normes comme OPTIMADE révolutionnera la science des matériaux en rationalisant l’intégration des données, en renforçant la collaboration et en stimulant une innovation rapide à travers de multiples industries.
Cliquez ici pour tout savoir sur l’investissement dans l’intelligence artificielle (IA).












