Materialvitenskap
Etablering av standarder for å maksimere fordelene ved kunstig intelligens

Materialvitenskap endrer seg raskt med fremveksten av kunstig intelligens (AI) og maskinlæring (ML). Disse verktøyene transformerer hvordan vi oppdager, designer og optimaliserer nye materialer for å takle de store utfordringene innen ren energi og bærekraftig produksjon, avansert elektronikk og biomedisin.
Imidlertid krever det å få mest mulig ut av AI i materialforskning mer enn bare fancy algoritmer og store datamengder. Det krever en robust, standardisert infrastruktur for å få tilgang til, dele og integrere materialdata på tvers av ulike kilder og domener. Uten standarder møter forskere store hindringer for å trene nøyaktige, generaliserbare modeller og få resultatene sine inn i den virkelige verden.
Her vil vi se på viktigheten av datastandarder for AI‑drevet materialoppdagelse, med fokus på den nye Open Databases Integration for Materials Design (OPTIMADE)‑initiativet. Vi vil dekke utfordringene med utveksling av materialdata, OPTIMADE‑API‑funksjonene og fordelene, samt virkelige eksempler på hvordan denne standarden allerede endrer materialforskning. Til slutt vil vi se på fremtiden for OPTIMADE og hva det kan bety for innovasjon innen nye materialer.

Utfordringene med utveksling av materialdata
For å forstå viktigheten av datastandarder i materialvitenskap, må du forstå utfordringene forskere står overfor når de skal få tilgang til og integrere data fra ulike kilder.
Materialdata har blitt spredt over et fragmentert landskap av databaser, hver med sitt eget dataschema, API og tilgangsprotokoller. Denne mangelen på interoperabilitet er en stor barriere for forskere som ønsker å bygge maskinlæringsmodeller eller utføre stor‑skala datamining.
Ta for eksempel en materialforsker som ønsker å oppdage nye batterimaterialer. For å trene en prediktiv modell, må de samle data om et bredt spekter av kjente batterikombinasjoner, deres krystallstrukturer, elektrokjemiske egenskaper og syntesebetingelser.
Imidlertid er disse dataene sannsynligvis spredt over flere databaser, hver med sin egen måte å representere og levere informasjonen på.
For å få tak i de relevante dataene, må forskeren:
- Skrive tilpasset kode for å spørre hver databases API
- Navigere i deres unike skjema
- Rense og slå sammen resultatene til et konsistent format.
Dette er tidkrevende, feilutsatt og krever teknisk ekspertise utenfor forskerens kjerneområde.
Dr. Julia Ling, en materialinformasjonsspesialist ved Lawrence Berkeley National Laboratory, har opplevd dette på første hånd. Hun sier:
“I mitt arbeid må jeg ofte integrere data fra flere databaser for å bygge omfattende treningssett for mine maskinlæringsmodeller. Men mangelen på standardisering på tvers av disse databasene er et stort problem. Jeg kan bruke uker på bare å skrive databehandlingsskript før jeg i det hele tatt kan begynne å trene modellene mine.”
Problemet forverres av at mange materialdatabaser er låst inne i individuelle forskningsgrupper eller institusjoner, slik at eksterne forskere ikke engang kan finne, for ikke å snakke om å få tilgang til potensielt verdifulle data. Denne mangelen på synlighet og tilgjengelighet holder vitenskapen tilbake og fører til unødvendig duplisering av innsats.
Dr. Bryce Meredig, medgründer og Chief Science Officer i Citrine Informatics, sier:
“Den nåværende tilstanden for materialdata er et rot. Dataene er spredt, heterogene og ofte dårlig dokumentert. Dette gjør det umulig å bruke dataene effektivt, spesielt for maskinlæring.”
Behovet for fellesskapsstandarder
For å overvinne disse utfordringene og få mest mulig ut av AI i materialforskning, trenger fellesskapet et felles sett med standarder og protokoller for datautveksling. Disse standardene bør tillate forskere å få tilgang til og integrere data fra ulike kilder i et konsistent, maskinlesbart format uten å måtte navigere gjennom hver enkelt databases kompleksitet.
Disse standardene må utvikles og tas i bruk av fellesskapet på en åpen og samarbeidsorientert måte. De kan ikke påtvinges top‑down av noen enkelt institusjon eller databaseleverandør. De må oppstå gjennom en konsensus‑ og iterasjonsprosess med innspill fra et bredt spekter av interessenter innen akademia, industri og myndigheter.
Fordelene er klare. Ved å tilby et felles språk og rammeverk for materialdatautveksling, kan de redusere barrierene for datatilgang og -integrasjon og la forskere bruke mer tid på vitenskap og mindre tid på datahåndtering. I tillegg kan de muliggjøre et rikt økosystem av interoperable verktøy og tjenester, fra datavisualiserings‑ og analyseplattformer til automatiserte oppdagelses‑pipelines og kunnskapsbaser.
Dr. Kristin Persson, direktør for Materials Project ved Lawrence Berkeley National Laboratory, sier at fellesskapsstandarder er nøkkelen til å få mest mulig ut av AI i materialvitenskap. Hun la til:
“Ved å bli enige om et felles sett med prinsipper og protokoller for datautveksling, kan vi åpne opp et helt nytt nivå av samarbeid og innovasjon i materialforskning. Det handler ikke bare om å gjøre data mer tilgjengelige, men om å muliggjøre ny vitenskap som tidligere var umulig.”
Fremveksten av OPTIMADE
Da behovet for fellesskapsstandarder i materialdatautveksling ble tydelig, samlet en gruppe ledende materialdatabaser og programvareleverandører seg i 2016 for å lansere Open Databases Integration for Materials Design (OPTIMADE)‑initiativet.
Målet med OPTIMADE er å utvikle en felles API‑spesifikasjon for spørring og henting av data fra materialdatabaser i et standardisert, maskinlesbart format. Ved å tilby ett enkelt grensesnitt til mange databaser, vil OPTIMADE gjøre det enklere for forskere å få tilgang til og integrere materialdata i sine arbeidsflyter uavhengig av hvilken database eller programvare de bruker.
OPTIMADE‑spesifikasjonen er basert på RESTful webdesign som bruker standard HTTP‑protokoller og JSON‑dataformater for å muliggjøre kommunikasjon mellom databaser og klientapplikasjoner. Den definerer et sett med felles endepunkter og spørringsparametere som databaser kan implementere for å eksponere sine data på en standardisert, selv‑beskrivende måte.
For eksempel kan en klientapplikasjon sende en enkel HTTP‑GET‑forespørsel til en OPTIMADE‑kompatibel database med spørringsparametere i et standardisert format for å søke etter materialer som inneholder jern og oksygen.
Databaseserveren oversetter deretter dette til sitt egen spørringsspråk, utfører søket, og returnerer resultatene i JSON. Klientapplikasjonen kan så parse og behandle disse resultatene ved hjelp av standardverktøy og -biblioteker uten å kjenne til det underliggende databaseskjemaet eller implementasjonsdetaljene.
OPTIMADE i praksis
Siden 2019 har OPTIMADE blitt tatt i bruk av mange materialdatabaser og programvareverktøy.
Et eksempel er Materials Project, en populær database med beregnede materialegenskaper som drives av Lawrence Berkeley National Laboratory. I 2020 implementerte Materials Project‑teamet et OPTIMADE‑API slik at brukere kunne få tilgang til det enorme datasettet ved hjelp av standard spørringsparametere og responsformater.
Ifølge Dr. Shyam Dwaraknath, ledende databasearkitekt:
“Materials Projects OPTIMADE‑API har vært en spillveksler for våre brukere. Det har muliggjort et helt nytt økosystem av verktøy og integrasjoner som gjør det enklere enn noen gang å få tilgang til og analysere dataene våre fra Jupyter‑notatbøker og nettapplikasjoner til høy‑gjennomstrømmings‑screening‑pipelines.”
NOMAD Archive, et lager for rådata fra høy‑gjennomstrømmings‑materials‑simuleringer, er en annen tidlig adopter av OPTIMADE. Ved å eksponere sine data gjennom et OPTIMADE‑API har NOMAD gjort det mulig for forskere å utføre stor‑skala datamining og trene maskinlæringsmodeller på et enormt datasett av beregnede egenskaper.
Ifølge Dr. Luca Ghiringhelli, gruppeleder ved Fritz Haber‑instituttet og AI‑entusiast innen materialvitenskap:
“Vi ser en reell bølge av interesse for datadrevet materialforskning, og OPTIMADE spiller en nøkkelrolle i dette. Ved å tilby ett enkelt grensesnitt til flere databaser senker det barrierene for datatilgang og -integrasjon og bidrar til å demokratisere feltet.”
Virkelige anvendelser
Effekten av OPTIMADE er allerede å se på tvers av mange materialforskningsområder, fra batterier og fornybar energi til romfart og biomedisinsk ingeniørkunst. Her er noen eksempler på hvordan dette skjer:
#1. Finne høyytelses termolektriske materialer: Forskere ved Northwestern University brukte OPTIMADE til å kombinere data fra flere beregningsdatabaser, inkludert Materials Project og OQMD, for å trene en maskinlæringsmodell som forutsier termolektriske egenskaper til nye materialer. Med dette datasettet klarte de å finne flere nye forbindelser med potensielt rekord‑brytende ytelse, som nå blir syntetisert og testet.
#2. Høy‑gjennomstrømmings‑screening av 2D‑materialer: Et team ved Danmarks Tekniske Universitet brukte OPTIMADE til å screene mer enn 50 000 beregnede 2D‑materialer fra Computational 2D Materials Database (C2DB). Ved å spørre databasen med OPTIMADE‑filtre, klarte de raskt å finne materialer med spesifikke egenskaper, som høy bærer‑mobilitet eller lavt båndgap, for neste generasjons elektronikk og optoelektronikk.
#3. Den raske utviklingen av nye batterimaterialer: Forskere ved MIT og Stanford University brukte OPTIMADE til å bygge en sentralisert database med batterimaterialegenskaper, ved å kombinere data fra Materials Project, OQMD og andre kilder. De trente en rekke maskinlæringsmodeller på dette datasettet for å forutsi nøkkel‑ytelsesmetrikker, som kapasitet og syklusstabilitet, for nye litium‑ion‑batterikjemier. Disse modellene brukes nå til å veilede eksperimentelle innsats for å utvikle sikrere, lengre‑levende og mer energitetthets‑rike batterier for el‑biler og strømnettslagring.
#4. Design av høy‑entropi legeringer: Et team ved University of Maryland brukte OPTIMADE til å kombinere data fra flere beregnings‑ og eksperimentelle databaser, inkludert Materials Project, OQMD og High‑Entropy Alloys Database (THEAD), for å bygge et datasett med egenskaper for høy‑entropi legeringer. De brukte dette datasettet til å trene en maskinlæringsmodell som forutsier dannelsesenergi og fase‑stabilitet for nye høy‑entropi legeringskomposisjoner. De klarte å screene tusenvis av kandidater og finne de mest lovende for eksperimentell validering. Dette arbeidet bidrar til å akselerere utviklingen av neste generasjons høy‑entropi legeringer med eksepsjonell styrke, seighet og korrosjonsbestandighet for romfart, forsvar og mer.
Nå skal vi se på hvilke selskaper som kan ha mest nytte av å etablere disse standardene.
#1. Tesla (TSLA)
Tesla, Inc. vil ha stor nytte av OPTIMADE‑standardisert datautveksling, som vil forbedre selskapets evne til å utvikle bedre batteriteknologier og optimalisere materialer i produksjonsprosessene. Dette vil hjelpe Tesla å lage batterier med høyere energitetthet, lengre levetid og forbedrede sikkerhetsfunksjoner, samtidig som kostnader reduseres og bærekraften økes.
(TSLA )
Finansielt sett rapporterte Tesla i 2023 en omsetning på 96,8 milliarder dollar, en økning på 19 % fra året før, noe som viser sterk finansiell vekst og potensial for fortsatt innovasjon.
#2. Intel Corporation (INTC)
Et annet selskap som vil ha betydelig nytte av OPTIMADE‑standardisert datautveksling er Intel Corporation (INTC), en leder innen teknologi‑ og halvledersektoren. Ved å utnytte AI og standardiserte materialdata kan Intel oppdage og designe nye halvledermaterialer, noe som fører til utvikling av chips med bedre ytelse, høyere effektivitet og nye funksjonaliteter.
Dette vil hjelpe Intel med å opprettholde sin posisjon i frontlinjen av halvlederinnovasjon. Videre vil integrering av data på tvers av ulike databaser strømlinjeforme Intels forsknings‑ og utviklingsprosesser, slik at mer fokus kan rettes mot innovasjon og mindre på datastyring.
(INTC )
På den finansielle siden rapporterte Intel en omsetning på 54,2 milliarder dollar i 2023, noe som reflekterer selskapets betydelige rolle i industrien og det vedvarende potensialet for vekst og utvikling.
Fremtiden for OPTIMADE
Etter hvert som OPTIMADE blir tatt i bruk mer og mer, utforsker materialvitenskapssamfunnet nye fronter innen data‑integrasjon og oppdagelse. Ett utviklingsområde er integrasjonen av OPTIMADE med andre datastandarder og ontologier, som European Materials Modelling Ontology (EMMO) og Crystallographic Information Framework (CIF).
Å justere disse ulike standardene og semantikkene vil tillate forskere å stille enda kraftigere og mer komplekse spørsmål på tvers av flere datakilder, lengder, tidsskalaer, og domener innen materialvitenskap.
Et annet fokusområde for fremtidig forskning er utviklingen av mer avanserte og automatiserte verktøy for materialdataanalyse og maskinlæring. Fremveksten av dype‑lærings‑teknikker som graf‑nevrale nettverk og transformer‑arkitekturer signaliserer et behov for både standardiserte og skalerbare måter å representere og behandle materialdata i disse modellene.
OPTIMADE er godt posisjonert til å spille en nøkkelrolle i dette rommet, da den kan tilby et felles grensesnitt for å få tilgang til og integrere store, mangfoldige datasett av materialegenskaper og strukturer. Som Dr. Matthias Scheffler, direktør for Fritz Haber‑instituttet og pioner innen beregningsmaterialvitenskap, sier:
“OPTIMADE handler ikke bare om å gjøre data mer tilgjengelige, det handler om å muliggjøre nye paradigmer for materialoppdagelse og -design. Ved å tilby et fundament for datadrevet og AI‑drevet materialforskning, bidrar vi til å innlede en ny æra av innovasjon og oppdagelse.”
Ser vi lenger fremover, er det også interesse for å bruke OPTIMADE til å muliggjøre mer desentraliserte og samarbeidsbaserte modeller for datadeling og oppdagelse av materialer. For eksempel utforsker noen forskere bruk av blokkjedeteknologi for å skape sikre, distribuerte nettverk av OPTIMADE‑databaser hvor data kan deles og forespørres på tvers av flere institusjoner og domener.
Andre ser på federert læring for å trene maskinlæringsmodeller på desentraliserte datasett uten behov for å sentralisere eller harmonisere dataene. Ved å la forskere hos selskaper som Matgenix og Data Science OÜ samarbeide og dele innsikt på tvers av institusjonelle grenser, samtidig som de beholder kontroll over sine egne data og immaterielle rettigheter, kan disse tilnærmingene akselerere tempoet for materialoppdagelse og innovasjon.
Klikk her for å lære hvorfor kunstig intelligens er en milliard‑dollar satsing for Cisco Systems.
Avsluttende tanker
AI og datadrevne teknikker i materialvitenskap endrer måten vi oppdager, designer og implementerer nye materialer på. Men for å realisere disse tilnærmingene fullt ut, trenger vi en robust, standardisert infrastruktur for å få tilgang til og integrere data på tvers av flere kilder og domener.
OPTIMADE‑API‑et er en nøkkeltilrettelegger for dette ved å tilby et felles språk og protokoll for å spørring og henting av materialdata i et maskinlesbart format. Ved å redusere barrierene for datatilgang og -integrasjon gjør OPTIMADE materialforskning mer demokratisk og akselererer innovasjon.
Etter hvert som OPTIMADE blir tatt i bruk mer og mer og nye verktøy og teknikker for datadrevet materialoppdagelse dukker opp, kan vi forvente enda mer i fremtiden. Fra nye batterimaterialer og høy‑ytelses legeringer til skreddersydde legemidler og funksjonelle nanomaterialer, er mulighetene uendelige.
Men for å realisere dette trenger vi vedvarende investering og samarbeid på tvers av materialvitenskapssamfunnet, samt åpne data, åpne standarder og åpen vitenskap. Kun ved å jobbe sammen på tvers av disiplinære og institusjonelle grenser kan vi håpe på å frigjøre den fulle kraften til AI og datadrevet oppdagelse i materialvitenskap.
Som Dr. Gerbrand Ceder, professor i materialvitenskap ved UC Berkeley og pioner innen beregningsmaterialdesign, sier:
“Fremtiden er lys, men vi må endre måten vi tenker på data og samarbeid. Ved å bruke åpne standarder som OPTIMADE og samarbeide som et fellesskap for å dele kunnskap, kan vi akselerere innovasjon og løse noen av de største problemene vi står overfor i dag.”
Alt i alt vil adopsjonen av standarder som OPTIMADE revolusjonere materialvitenskap ved å strømlinjeforme data‑integrasjon, styrke samarbeid og drive rask innovasjon på tvers av flere industrier.
Klikk her for å lære alt om investering i kunstig intelligens (AI).












