材料科学

人工知能の利益を最大化するための標準の確立

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.

材料科学は、人工知能(AI)と機械学習(ML)の台頭により急速に変化しています。これらのツールは、クリーンエネルギーと持続可能な製造、先端電子機器、バイオメディシンの大きな課題に取り組むために、新しい材料を発見、設計、最適化する方法を変革しています。

しかし、材料研究でAIを最大限に活用するには、ただの高度なアルゴリズムとビッグデータだけでは不十分です。さまざまなソースとドメイン間で材料データにアクセス、共有、統合するための堅牢で標準化されたインフラストラクチャが必要です。標準がないと、研究者は正確で汎用性の高いモデルをトレーニングし、結果を現実世界に導入するための大きな障壁に直面します。

ここでは、AI駆動の材料発見のためのデータ標準の重要性について、特に新しいオープン データベース統合 for 材料設計(OPTIMADE)イニシアチブに焦点を当てて説明します。材料データ交換の課題、OPTIMADE APIの機能と利点、以及この標準がすでに材料研究をどのように変えているかについて説明します。最後に、OPTIMADEの将来と、新しい材料のイノベーションに与える可能性について見ていきます。

Optimade API Call

材料データ交換の課題

材料科学におけるデータ標準の重要性を理解するには、研究者がさまざまなソースからデータにアクセスして統合する際に直面する課題を理解する必要があります。

材料データは、各々が独自のデータスキーマ、API、およびアクセスプロトコルを持つ断片化されたデータベースの風景に散在しています。この相互運用性の欠如は、機械学習モデルを構築したり、大規模なデータマイニングを行ったりしようとする研究者にとって大きな障壁です。

たとえば、新しいバッテリー材料を発見したい材料科学者を考えてみましょう。予測モデルをトレーニングするには、多種多様な既知のバッテリー化合物、結晶構造、電気化学的特性、合成条件に関するデータを収集する必要があります。

ただし、このデータは、情報を表現して提供する方法が異なる複数のデータベースに分散している可能性があります。

関連するデータを取得するには、研究者は次のことを行う必要があります:

  • 各データベースのAPIを問い合わせるためのカスタムコードを書く
  • ユニークなスキーマをナビゲートする
  • 結果を一貫した形式にクリーンアップしてマージする

これは時間がかかり、エラーが発生しやすく、研究者の核となるドメイン以外の技術的専門知識が必要です。

ローレンス バークレー 国立研究所の材料インフォマティクス科学者であるジュリア リング博士は、この経験を直接経験しています。她はこう言います。

「私の仕事では、機械学習モデルの包括的なトレーニングセットを構築するために、複数のデータベースからデータを統合する必要があります。しかし、これらのデータベース間の標準化の欠如は大きな問題です。モデルのトレーニングを開始する前に、データ処理スクリプトを書くのに数週間を費やすことがあります。」

問題は、多くの材料データベースが個々の研究グループまたは機関にロックされており、外部の研究者はアクセスすることさえできない、そして潜在的に貴重なデータが見つからないという事実によって悪化しています。この可視性とアクセシビリティの欠如は、科学の進歩を妨げ、不必要な重複作業を引き起こしています。

Citrine Informaticsの共同創設者兼チーフ サイエンス オフィサーのブライス メレディグ博士は次のように述べています:

「現在の材料データの状態は混沌です。それは散在しており、非同質であり、そしてしばしば不完全に文書化されています。これにより、特に機械学習のために、このデータを効果的に使用することが不可能になります。」

コミュニティ標準の必要性

これらの課題を克服し、材料研究でAIを最大限に活用するには、コミュニティはデータ交換のための共通の標準とプロトコルを必要とします。これらの標準は、研究者が個々のデータベースの複雑さをナビゲートすることなく、一貫した、マシンリーダブルな形式でさまざまなソースからのデータにアクセスして統合できるようにする必要があります。

これらの標準は、学術界、産業界、政府機関を含む幅広い利害関係者からの入力と、合意と反復のプロセスを通じて、コミュニティによって開発され、採用される必要があります。上から押し付けられたものであってはなりません。標準の利点は明らかです。材料データ交換のための共通の言語とフレームワークを提供することで、データへのアクセスと統合の障壁を減らし、研究者が科学に費やす時間を増やし、データの手間を減らすことができます。さらに、データ視覚化と分析プラットフォームから自動化された発見パイプラインとナレッジベースまで、相互運用可能なツールとサービスを備えた豊かなエコシステムを可能にすることができます。

ローレンス バークレー 国立研究所のMaterials Projectのディレクターであるクリスティン パーソン博士は、材料科学におけるAIの最大の利点を得るためにコミュニティ標準が重要であると述べています。她は次のように付け加えました。

“データ交換のための共通の原則とプロトコルに合意することで、材料研究における新しいレベルのコラボレーションとイノベーションを開拓することができます。これは、データをよりアクセスしやすくすることだけではなく、新しい科学を可能にすることです。”

OPTIMADEの台頭

材料データ交換のためのコミュニティ標準の必要性を認識して、主要な材料データベースとソフトウェアプロバイダーの一群が2016年にオープン データベース統合 for 材料設計(OPTIMADE)イニシアチブを立ち上げました。

OPTIMADEの目的は、標準化された、マシンリーダブルな形式で材料データベースからデータを問い合わせて取得するための共通のAPI仕様を開発することです。多数のデータベースに単一のインターフェイスを提供することで、OPTIMADEは、研究者が使用するデータベースやソフトウェアに関係なく、材料データにアクセスして統合することを容易にします。

OPTIMADE仕様は、RESTful Webデザインを使用して、標準のHTTPプロトコルとJSONデータ形式で、データベースとクライアントアプリケーションの間の通信を可能にします。データベースが実装して、自己記述的な方法でデータを公開するための共通のエンドポイントとクエリパラメータのセットを定義します。

たとえば、クライアントアプリケーションは、標準化された形式のクエリパラメータで、鉄と酸素を含む材料を検索するために、OPTIMADE準拠データベースに単純なHTTP GETリクエストを送信できます。

データベースサーバーはこれを自身のクエリ言語に翻訳し、検索を実行し、JSONで結果を返します。クライアントアプリケーションは、標準のツールとライブラリを使用して結果を解析して処理できますが、基礎となるデータベーススキーマまたは実装の詳細を知る必要はありません。

OPTIMADEの実践

2019年以来、OPTIMADEは多くの材料データベースとソフトウェアツールによって採用されてきました。

1つの例は、ローレンス バークレー 国立研究所がホストする人気の材料データベースであるMaterials Projectです。2020年、Materials Projectチームは、ユーザーが標準のクエリパラメータとレスポンス形式を使用してその膨大なデータセットにアクセスできるように、OPTIMADE APIを実装しました。

データベースアーキテクトのシャム・ドワルカナス博士によれば:

「Materials ProjectのOPTIMADE APIは、ユーザーにとってゲームチェンジャーでした。JupyterノートブックやWebアプリケーション、高スループットスクリーニングパイプラインまで、ツールや統合の新しいエコシステムを可能にしました。」

高スループット材料シミュレーションの生データを収めたリポジトリであるNOMADアーカイブも、OPTIMADEの早期採用者です。OPTIMADE APIを介してデータを公開することで、NOMADは研究者が大量の計算特性のデータセットで大規模なデータマイニングを行い、機械学習モデルをトレーニングできるようにしました。

フリッツ ハーバー研究所のグループリーダーであり、材料科学におけるAIの熱心な支持者であるルカ・ギリンゲリ博士によれば:

「データ駆動型材料研究への関心の増大を目にしています。OPTIMADEはこの分野で重要な役割を果たしています。単一のインターフェイスを提供することで、データへのアクセスと統合の障壁を下げ、分野を民主化するのに役立っています。」

実際の応用

OPTIMADEの影響は、バッテリーと再生可能エネルギーから航空宇宙とバイオメディカルエンジニアリングまで、多くの材料研究分野で既に実現されています。OPTIMADEが実際にどのように機能しているかについては、以下にいくつかの例を示します。

#1. 高性能熱電材料の発見:ノースウェスタン大学の研究者は、Materials ProjectやOQMDを含む複数の計算データベースからのデータをOPTIMADEで組み合わせて、熱電特性の予測に使用する機械学習モデルをトレーニングしました。このデータセットを使用して、記録的なパフォーマンスが可能な新しい化合物をいくつか発見し、現在、これらが合成されてテストされています。

#2. 2D材料の高スループットスクリーニング:デンマーク工科大学のチームは、OPTIMADEを使用して、Computational 2D Materials Database (C2DB)から計算された2D材料を5万以上スクリーニングしました。OPTIMADEフィルタを使用してデータベースをクエリすることで、次世代のエレクトロニクスと光エレクトロニクス向けに、高いキャリア移動度や低いバンドギャップなどの特定の特性を持つ材料を迅速に見つけることができました。

#3. 新しいバッテリー材料の迅速な開発:MITとスタンフォード大学の研究者は、Materials ProjectやOQMDを含む複数のソースからのバッテリー材料特性の集中データベースをOPTIMADEで構築しました。新しいリチウムイオンバッテリー化学の重要なパフォーマンスメトリクス(容量やサイクル寿命など)を予測するために、このデータセットで一連の機械学習モデルをトレーニングしました。これらのモデルは現在、実験的努力を導くために使用されており、より安全で、長寿命で、エネルギー密度の高いバッテリーを電気自動車とグリッドストレージのために開発することを目指しています。

#4. 高エントロピー合金の設計:メリーランド大学のチームは、Materials Project、OQMD、High-Entropy Alloys Database (THEAD)を含む複数の計算および実験データベースからのデータをOPTIMADEで組み合わせて、高エントロピー合金特性のデータセットを構築しました。このデータセットを使用して、新しい高エントロピー合金組成の形成エネルギーと相安定性を予測する機械学習モデルをトレーニングしました。候補者を数千件スクリーニングし、最も有望なものを実験的に検証することができました。この研究は、航空宇宙、防衛、その他の分野で優れた強度、靱性、腐食耐性を持つ次世代の高エントロピー合金の開発を促進するのに役立ちます。

では、標準の確立から最も多く利益を得ることができる企業について見てみましょう。

#1. テスラ(TSLA)

テスラ株式会社は、バッテリー技術の開発と製造プロセスにおける材料の最適化を強化できるため、OPTIMADEの標準化されたデータ交換から大幅に利益を得ることになります。これにより、テスラは、エネルギー密度が高く、寿命が長く、安全性が高く、コストが低く、持続可能性が高くなるバッテリーを作成できます。

(TSLA )

財務面では、テスラは2023年に964億ドルという収益を報告し、前年比19%の増加で、強力な財務成長と継続的なイノベーションの可能性を示しています。

#2. インテル株式会社(INTC)

OPTIMADEの標準化されたデータ交換から大幅に利益を得ることになる別の企業は、テクノロジーと半導体分野のリーダーであるインテル株式会社(INTC)です。AIと標準化された材料データを活用することで、インテルは新しい半導体材料を発見して設計することができます。これにより、パフォーマンスが向上し、効率が高まり、新しい機能が実現するチップの開発が可能になります。

これにより、インテルは半導体イノベーションの最前線に立っています。さらに、さまざまなデータベース間のデータの統合により、インテルの研究開発プロセスが合理化され、イノベーションに重点を置くことができます。

(INTC )

財務面では、インテルは2023年に542億ドルの収益を報告し、業界における重要な役割と継続的な成長と開発の可能性を示しています。

OPTIMADEの将来

OPTIMADEが採用され続けるにつれて、材料科学コミュニティはデータ統合と発見の新たな境界を探索しています。開発の1つの分野は、OPTIMADEを他のデータ標準やオントロジー、たとえばヨーロッパ材料モデリングオントロジー(EMMO)や結晶学情報フレームワーク(CIF)と統合することです。

これらの異なる標準とセマンティクスを整列することで、研究者は複数のデータソース、長さ、時間スケール、材料科学のドメインを横断して、さらに強力で複雑な質問を問うことができるようになります。

将来の研究のもう1つの分野は、材料データ分析と機械学習のためのより高度で自動化されたツールの開発です。グラフニューラルネットワークやトランスフォーマーアーキテクチャなどのディープラーニング技術の台頭は、これらのモデルで材料データを表現して処理するための標準化されたスケーラブルな方法の必要性を示しています。

OPTIMADEは、この空間で重要な役割を果たすことができます。材料特性と構造の大規模で多様なデータセットにアクセスして統合するための共通のインターフェイスを提供することで、データ駆動型およびAIを活用した材料研究の基盤を提供するのに役立ちます。

フリッツ ハーバー研究所のディレクターであり、計算材料科学の先駆者であるマティアス シェフラー博士は次のように述べています:

「OPTIMADEは、データをよりアクセスしやすくすることだけではなく、新しい材料発見と設計のための新しいパラダイムを可能にするものです。データ駆動型およびAIを活用した材料研究の基盤を提供することで、イノベーションと発見の新しい時代をもたらすのに役立ちます。」

さらに先を見ると、材料の発見と共有のためのより分散型およびコラボレーション型のモデルを可能にするために、OPTIMADEを使用することへの関心もあります。たとえば、研究者の一部は、データを共有して問い合わせることができる、OPTIMADEデータベースのセキュアで分散されたネットワークを作成するためにブロックチェーンを使用することを検討しています。

他は、データを集中化または調和させる必要なく、分散データセットで機械学習モデルをトレーニングできるフェデレーテッドラーニングに注目しています。MatgenixやData Science OÜのような企業の研究者が機関の境界を越えてコラボレーションしてインサイトを共有できるようにすることで、材料の発見とイノベーションのペースを加速することができます。

シスコシステムズ株式会社にとって人工知能が10億ドル規模のプレイになる理由をこちらでご覧ください。

結論

材料科学におけるAIとデータ駆動型技術は、材料の発見、設計、展開の方法を変えつつあります。しかし、これらのアプローチの完全な実現には、複数のソースとドメインを横断してデータにアクセスして統合するための堅牢で標準化されたインフラストラクチャが必要です。

OPTIMADE APIは、これを可能にする重要なエナブラーです。材料データ交換のための共通の言語とプロトコルを提供することで、OPTIMADEは材料研究をより民主化し、イノベーションを加速します。

OPTIMADEが採用され、データ駆動型材料発見のための新しいツールとテクニックが登場するにつれて、未来はより多くのものを約束しています。新しいバッテリー材料、高性能合金、カスタマイズされた薬剤、機能性ナノ材料など、可能性は無限です。

しかし、これを実現するには、材料科学コミュニティ全体の持続可能な投資とコラボレーション、およびオープンデータ、オープンスタンダード、オープンサイエンスが必要です。学術的および機関的境界を越えて協力することでのみ、材料科学におけるAIとデータ駆動型発見の完全な力を解き放つことができます。

UCバークレーの材料科学教授であり、計算材料設計の先駆者であるゲルブランド セダー博士は次のように述べています:

「未来は明るいですが、データとコラボレーションについての考え方を変える必要があります。OPTIMADEのようなオープンスタンダードを使用し、コミュニティとして知識を共有することで、イノベーションを加速し、今日直面している大きな課題を解決することができます。」

全体として、OPTIMADEのような標準の採用は、データ統合を合理化し、コラボレーションを強化し、複数の業界で急速なイノベーションを促進することで、材料科学を革命的に変えることになります。

人工知能(AI)への投資について、すべての必要な情報をこちらでご覧ください。

ガウラブは2017年に暗号通貨取引を開始し、以来暗号通貨スペースに恋に落ちました。彼のすべての暗号通貨への興味は、暗号通貨とブロックチェーンを専門とするライターに変貌しました。すぐに彼は暗号通貨会社やメディア・アウトレットと一緒に仕事をすることになりました。また、彼は大きなバットマンのファンです。