Ciencia de materiales

Estableciendo estándares para maximizar el beneficio de la inteligencia artificial

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.

La ciencia de los materiales está cambiando rápidamente con el auge de la inteligencia artificial (IA) y el aprendizaje automático (ML). Estas herramientas están transformando cómo descubrimos, diseñamos y optimizamos nuevos materiales para abordar los grandes desafíos en energía limpia y fabricación sostenible, electrónica avanzada y biomedicina.

Sin embargo, obtener el máximo provecho de la IA en la investigación de materiales requiere más que algoritmos sofisticados y grandes volúmenes de datos. Requiere una infraestructura robusta y estandarizada para acceder, compartir e integrar datos de materiales a través de diferentes fuentes y dominios. Sin estándares, los investigadores se enfrentan a grandes barreras para entrenar modelos precisos y generalizables y llevar sus resultados al mundo real.

Aquí, analizaremos la importancia de los estándares de datos para el descubrimiento de materiales impulsado por IA, con un enfoque en la nueva Open Databases Integration for Materials Design (OPTIMADE). Cubriremos los desafíos del intercambio de datos de materiales, las características y beneficios de la API OPTIMADE, y ejemplos reales de cómo este estándar ya está cambiando la investigación de materiales. Finalmente, veremos el futuro de OPTIMADE y lo que podría significar para la innovación en nuevos materiales.

Optimade API Call

Los desafíos del intercambio de datos de materiales

Para comprender la importancia de los estándares de datos en la ciencia de los materiales, es necesario entender los desafíos que enfrentan los investigadores al acceder e integrar datos de diferentes fuentes.

Los datos de materiales se encuentran dispersos en un panorama fragmentado de bases de datos, cada una con su propio esquema de datos, API y protocolos de acceso. Esta falta de interoperabilidad es una gran barrera para los investigadores que desean construir modelos de aprendizaje automático o realizar minería de datos a gran escala.

Tome, por ejemplo, a un científico de materiales que quiere descubrir nuevos materiales para baterías. Para entrenar un modelo predictivo, necesitaría recopilar datos sobre una amplia gama de compuestos de baterías conocidos, sus estructuras cristalinas, propiedades electroquímicas y condiciones de síntesis.

Sin embargo, estos datos probablemente estén distribuidos en múltiples bases de datos, cada una con su propia forma de representar y servir la información.

Para obtener los datos relevantes, el investigador tendría que:

  • Escribir código personalizado para consultar la API de cada base de datos
  • Navegar por sus esquemas únicos
  • Limpiar y combinar los resultados en un formato consistente.

Esto es laborioso, propenso a errores y requiere experiencia técnica fuera del dominio principal del investigador.

La Dra. Julia Ling, científica de informática de materiales en el Laboratorio Nacional Lawrence Berkeley, ha experimentado esto de primera mano. Ella dice:

“En mi trabajo, a menudo necesito integrar datos de múltiples bases de datos para construir conjuntos de entrenamiento completos para mis modelos de aprendizaje automático. Pero la falta de estandarización entre estas bases de datos es un gran problema. Puedo pasar semanas simplemente escribiendo scripts de procesamiento de datos antes de poder siquiera comenzar a entrenar mis modelos.”

El problema se agrava por el hecho de que muchas bases de datos de materiales están cerradas dentro de grupos de investigación o instituciones individuales, por lo que los investigadores externos ni siquiera pueden encontrarlas, y mucho menos acceder a datos potencialmente valiosos. Esta falta de visibilidad y accesibilidad está frenando la ciencia y provocando duplicaciones innecesarias de esfuerzo.

El Dr. Bryce Meredig, cofundador y Director de Ciencia de Citrine Informatics, dice:

“El estado actual de los datos de materiales es un caos. Está disperso, es heterogéneo y a menudo está mal documentado. Esto hace imposible utilizar estos datos de manera eficaz, especialmente para el aprendizaje automático.”

La necesidad de estándares comunitarios

Para superar estos desafíos y obtener el máximo provecho de la IA en la investigación de materiales, la comunidad necesita un conjunto común de estándares y protocolos para el intercambio de datos. Estos estándares deben permitir a los investigadores acceder e integrar datos de diferentes fuentes en un formato consistente, legible por máquinas sin tener que navegar por las complejidades de cada base de datos individual.

Estos estándares deben ser desarrollados y adoptados por la comunidad de forma abierta y colaborativa. No pueden ser impuestos de arriba hacia abajo por una sola institución o proveedor de bases de datos. Deben emerger de un proceso de consenso e iteración con la participación de una amplia gama de partes interesadas de la academia, la industria y el gobierno.

Los beneficios son claros. Al proporcionar un lenguaje y un marco comunes para el intercambio de datos de materiales, pueden reducirse las barreras al acceso e integración de datos y permitir que los investigadores dediquen más tiempo a la ciencia y menos al manejo de datos. Además, pueden habilitar un ecosistema rico de herramientas y servicios interoperables, que van desde plataformas de visualización y análisis de datos hasta pipelines automatizados de descubrimiento y bases de conocimiento.

La Dra. Kristin Persson, directora del Materials Project en el Laboratorio Nacional Lawrence Berkeley, dice que los estándares comunitarios son clave para aprovechar al máximo la IA en la ciencia de los materiales. Añade:

“Al acordar un conjunto común de principios y protocolos para el intercambio de datos, podemos abrir un nivel completamente nuevo de colaboración e innovación en la investigación de materiales. No se trata solo de hacer los datos más accesibles, sino de habilitar una nueva ciencia que antes era imposible.”

El auge de OPTIMADE

Al reconocer la necesidad de estándares comunitarios en el intercambio de datos de materiales, un grupo de bases de datos y proveedores de software líderes se unió en 2016 para lanzar la iniciativa Open Databases Integration for Materials Design (OPTIMADE).

El objetivo de OPTIMADE es desarrollar una especificación de API común para consultar y recuperar datos de bases de datos de materiales en un formato estandarizado y legible por máquinas. Al proporcionar una única interfaz a muchas bases de datos, OPTIMADE facilitará a los investigadores el acceso e integración de datos de materiales en sus flujos de trabajo, independientemente de la base de datos o el software que utilicen.

La especificación OPTIMADE se basa en un diseño web RESTful que utiliza protocolos HTTP estándar y formatos de datos JSON para habilitar la comunicación entre bases de datos y aplicaciones cliente. Define un conjunto de endpoints y parámetros de consulta comunes que las bases de datos pueden implementar para exponer sus datos de manera estandarizada y auto‑descriptiva.

Por ejemplo, una aplicación cliente puede enviar una simple solicitud HTTP GET a una base de datos compatible con OPTIMADE con los parámetros de consulta en un formato estandarizado para buscar materiales que contengan hierro y oxígeno.

El servidor de la base de datos traduce entonces esto a su propio lenguaje de consulta, ejecuta la búsqueda y devuelve los resultados en JSON. La aplicación cliente puede luego analizar y procesar esos resultados usando herramientas y bibliotecas estándar sin conocer el esquema subyacente de la base de datos ni sus detalles de implementación.

OPTIMADE en acción

Desde 2019, OPTIMADE ha sido adoptado por muchas bases de datos y herramientas de software de materiales.

Un ejemplo es el Materials Project, una base de datos popular de propiedades de materiales calculadas alojada por el Laboratorio Nacional Lawrence Berkeley. En 2020, el equipo del Materials Project implementó una API OPTIMADE para que los usuarios pudieran acceder a su vasto conjunto de datos usando parámetros de consulta y formatos de respuesta estándar.

Según el Dr. Shyam Dwaraknath, arquitecto principal de la base de datos:

“La API OPTIMADE del Materials Project ha sido un cambio de juego para nuestros usuarios. Ha permitido un ecosistema completo de herramientas e integraciones que facilitan más que nunca el acceso y análisis de nuestros datos desde cuadernos Jupyter y aplicaciones web hasta pipelines de cribado de alto rendimiento.”

NOMAD Archive, un repositorio de datos brutos de simulaciones de materiales de alto rendimiento, es otro adoptante temprano de OPTIMADE. Al exponer sus datos a través de una API OPTIMADE, NOMAD ha permitido a los investigadores realizar minería de datos a gran escala y entrenar modelos de aprendizaje automático sobre un enorme conjunto de datos de propiedades calculadas.

Según el Dr. Luca Ghiringhelli, líder de grupo en el Instituto Fritz Haber y entusiasta de la IA en la ciencia de materiales:

“Estamos viendo un verdadero auge del interés en la investigación de materiales impulsada por datos, y OPTIMADE está desempeñando un papel clave en esto. Al proporcionar una única interfaz a múltiples bases de datos, está reduciendo las barreras al acceso e integración de datos y ayudando a democratizar el campo.”

Aplicaciones del mundo real

El impacto de OPTIMADE ya se está viendo en numerosas áreas de investigación de materiales, desde baterías y energía renovable hasta aeroespacial e ingeniería biomédica. Aquí hay algunos ejemplos de cómo está sucediendo:

#1. Descubrimiento de termoelectricos de alto rendimiento: Investigadores de la Universidad Northwestern utilizaron OPTIMADE para combinar datos de múltiples bases de datos computacionales, incluidos el Materials Project y OQMD, y entrenar un modelo de aprendizaje automático para predecir las propiedades termoeléctricas de nuevos materiales. Con este conjunto de datos, pudieron encontrar varios compuestos nuevos con un rendimiento potencialmente récord, que ahora se están sintetizando y probando.

#2. Cribado de alto rendimiento de materiales 2D: Un equipo de la Universidad Técnica de Dinamarca utilizó OPTIMADE para examinar más de 50 000 materiales 2D calculados del Computational 2D Materials Database (C2DB). Al consultar la base de datos usando filtros OPTIMADE, pudieron encontrar rápidamente materiales con propiedades específicas, como alta movilidad de portadores o bajo ancho de banda, para electrónica y optoelectrónica de próxima generación.

#3. Desarrollo rápido de nuevos materiales para baterías: Investigadores del MIT y de la Universidad de Stanford utilizaron OPTIMADE para construir una base de datos centralizada de propiedades de materiales de baterías, combinando datos del Materials Project, OQMD y otras fuentes. Entrenaron una serie de modelos de aprendizaje automático con este conjunto de datos para predecir métricas clave de rendimiento, como capacidad y ciclado, para nuevas químicas de baterías de iones de litio. Estos modelos ahora se utilizan para guiar esfuerzos experimentales que desarrollen baterías más seguras, de mayor duración y mayor densidad energética para vehículos eléctricos y almacenamiento en red.

#4. Diseño de aleaciones de alta entropía: Un equipo de la Universidad de Maryland utilizó OPTIMADE para combinar datos de múltiples bases de datos computacionales y experimentales, incluidos el Materials Project, OQMD y la High‑Entropy Alloys Database (THEAD), y crear un conjunto de datos de propiedades de aleaciones de alta entropía. Usaron este conjunto para entrenar un modelo de aprendizaje automático que predice las energías de formación y la estabilidad de fase de nuevas composiciones de aleaciones de alta entropía. Pudieron cribear miles de candidatos y encontrar los más prometedores para su validación experimental. Este trabajo está acelerando el desarrollo de aleaciones de alta entropía de próxima generación con resistencia, tenacidad y resistencia a la corrosión excepcionales para aeroespacial, defensa y más allá.

Ahora, veamos qué empresas pueden beneficiarse más de establecer estos estándares.

#1. Tesla (TSLA)

Tesla, Inc. se beneficiará enormemente del intercambio de datos estandarizado de OPTIMADE, lo que mejorará su capacidad para desarrollar mejores tecnologías de baterías y optimizar materiales en sus procesos de fabricación. Esto ayudará a Tesla a crear baterías con mayor densidad energética, ciclos de vida más largos y características de seguridad mejoradas, al mismo tiempo que reduce costos y mejora la sostenibilidad.

(TSLA )

Desde el punto de vista financiero, en 2023 Tesla reportó ingresos de 96,8 mil millones de dólares, un aumento del 19 % respecto al año anterior, lo que muestra su fuerte crecimiento financiero y su potencial para seguir innovando.

#2. Intel Corporation (INTC)

Otra empresa que se beneficiará sustancialmente del intercambio de datos estandarizado de OPTIMADE es Intel Corporation (INTC), líder en los sectores de tecnología y semiconductores. Aprovechando la IA y los datos de materiales estandarizados, Intel puede descubrir y diseñar nuevos materiales semiconductores, lo que conduce al desarrollo de chips con mejor rendimiento, mayor eficiencia y nuevas funcionalidades.

Esto ayudará a Intel a mantener su posición a la vanguardia de la innovación en semiconductores. Además, la integración de datos de diversas bases de datos agilizará los procesos de investigación y desarrollo de Intel, permitiendo enfocarse más en la innovación y menos en la gestión de datos.

(INTC )

En el aspecto financiero, Intel reportó ingresos de 54,2 mil millones de dólares en 2023, reflejando el papel sustancial de la compañía en la industria y su continuo potencial de crecimiento y desarrollo.

El futuro de OPTIMADE

A medida que OPTIMADE se adopta cada vez más, la comunidad de ciencia de los materiales está explorando nuevas fronteras de integración y descubrimiento de datos. Una zona de desarrollo es la integración de OPTIMADE con otros estándares de datos y ontologías, como la European Materials Modelling Ontology (EMMO) y el Crystallographic Information Framework (CIF).

Alinear estos diferentes estándares y semánticas permitirá a los investigadores formular preguntas aún más poderosas y complejas a través de múltiples fuentes de datos, escalas de tiempo y dominios de la ciencia de los materiales.

Otra área de enfoque para la investigación futura es el desarrollo de herramientas más avanzadas y automatizadas para el análisis de datos de materiales y el aprendizaje automático. El auge de técnicas de deep learning como redes neuronales de grafos y arquitecturas transformer indica la necesidad de formas tanto estandarizadas como escalables de representar y procesar datos de materiales en estos modelos.

OPTIMADE está bien posicionada para desempeñar un papel clave en este espacio, ya que puede proporcionar una interfaz común para acceder e integrar grandes y diversos conjuntos de datos de propiedades y estructuras de materiales. Como dice el Dr. Matthias Scheffler, director del Instituto Fritz Haber y pionero en la ciencia computacional de materiales:

“OPTIMADE no se trata solo de hacer los datos más accesibles, sino de habilitar nuevos paradigmas para el descubrimiento y diseño de materiales. Al proporcionar una base para la investigación de materiales impulsada por datos y IA, estamos ayudando a inaugurar una nueva era de innovación y descubrimiento.”

Mirando más adelante, también hay interés en usar OPTIMADE para habilitar modelos más descentralizados y colaborativos de intercambio de datos y descubrimiento de materiales. Por ejemplo, algunos investigadores están explorando el uso de blockchain para crear redes seguras y distribuidas de bases de datos OPTIMADE donde los datos puedan compartirse y consultarse entre múltiples instituciones y dominios.

Otros están investigando el aprendizaje federado para entrenar modelos de aprendizaje automático en conjuntos de datos descentralizados sin necesidad de centralizar o armonizar los datos. Al permitir que investigadores de empresas como Matgenix y Data Science OÜ colaboren y compartan ideas a través de fronteras institucionales mientras siguen controlando sus propios datos e IP, estos enfoques podrían acelerar el ritmo del descubrimiento e innovación de materiales.

Haga clic aquí para aprender por qué la inteligencia artificial es una apuesta de mil millones de dólares para Cisco Systems.

Conclusiones

La IA y las técnicas basadas en datos en la ciencia de los materiales están cambiando la forma en que descubrimos, diseñamos y desplegamos nuevos materiales. Pero para realizar plenamente estos enfoques, necesitamos una infraestructura robusta y estandarizada para acceder e integrar datos a través de múltiples fuentes y dominios.

La API OPTIMADE es un habilitador clave al proporcionar un lenguaje y protocolo comunes para consultar y recuperar datos de materiales en un formato legible por máquinas. Al reducir las barreras al acceso e integración de datos, OPTIMADE está democratizando la investigación de materiales y acelerando la innovación.

A medida que OPTIMADE se adopta cada vez más y surgen nuevas herramientas y técnicas para el descubrimiento de materiales impulsado por datos, podemos esperar aún más avances en el futuro. Desde nuevos materiales para baterías y aleaciones de alto rendimiento hasta fármacos personalizados y nanomateriales funcionales, las posibilidades son infinitas.

Pero para lograrlo, necesitamos una inversión sostenida y colaboración en toda la comunidad de ciencia de los materiales, así como datos abiertos, estándares abiertos y ciencia abierta. Solo trabajando juntos a través de fronteras disciplinarias e institucionales podemos liberar todo el potencial de la IA y el descubrimiento basado en datos en la ciencia de los materiales.

Como dice el Dr. Gerbrand Ceder, profesor de ciencia de los materiales en UC Berkeley y pionero en el diseño computacional de materiales:

“El futuro es prometedor, pero debemos cambiar la forma en que pensamos sobre los datos y la colaboración. Al usar estándares abiertos como OPTIMADE y trabajar juntos como comunidad para compartir conocimientos, podemos acelerar la innovación y resolver algunos de los mayores problemas que enfrentamos hoy.”

En conjunto, la adopción de estándares como OPTIMADE revolucionará la ciencia de los materiales al simplificar la integración de datos, mejorar la colaboración y acelerar la innovación rápida en múltiples industrias.

Haga clic aquí para aprender todo sobre la inversión en inteligencia artificial (IA).

Gaurav comenzó a operar con criptomonedas en 2017 y se enamoró del espacio cripto desde entonces. Su interés en todo lo relacionado con criptomonedas lo convirtió en un escritor especializado en criptomonedas y blockchain. Pronto se encontró trabajando con empresas de criptomonedas y medios de comunicación. También es un gran fanático de Batman.