stub Establishing Standards to Maximize the Benefit of Artificial Intelligence – Securities.io
与我们联系

材料科学

制定标准,最大限度地发挥人工智能的优势

mm

Securities.io 保持严格的编辑标准,并可能从审核过的链接中收取报酬。我们不是注册投资顾问,这不是投资建议。请查看我们的 关联公司披露.

随着人工智能(AI)和机器学习(ML)的兴起,材料科学正在发生日新月异的变化。这些工具正在改变我们发现、设计和优化新材料的方式,以应对以下领域的重大挑战 清洁能源 和可持续制造、先进电子和生物医学。

然而,要在材料研究中充分利用人工智能,需要的不仅仅是花哨的算法和大数据。它需要一个强大的标准化基础设施来访问、共享和整合不同来源和领域的材料数据。没有标准,研究人员在训练准确、可推广的模型并将结果应用于现实世界时就会面临巨大障碍。

在这里,我们将探讨数据标准对于人工智能驱动的材料发现的重要性,重点是新的 为材料设计整合开放式数据库 (OPTIMADE) 计划。我们将介绍材料数据交换所面临的挑战、OPTIMADE 应用程序接口的功能和优势,以及该标准如何改变材料研究的实际案例。最后,我们将展望 OPTIMADE 的未来及其对新材料创新的意义。

Optimade API Call

材料数据交换的挑战

要了解数据标准在材料科学领域的重要性,就需要了解研究人员在访问和整合不同来源的数据时所面临的挑战。

材料数据分散在各式各样的数据库中,每个数据库都有自己的数据模式、应用程序接口和访问协议。这种互操作性的缺失对于想要建立机器学习模型或进行大规模数据挖掘的研究人员来说是一个巨大的障碍。

例如,一位材料科学家希望 发现新型电池材料.为了训练一个预测模型,他们需要收集有关各种已知电池化合物、其晶体结构、电化学特性和合成条件的数据。

然而,这些数据可能分散在多个数据库中,每个数据库都有自己的 拥有 表示和提供信息的方式。

为了获取相关数据,研究人员需要

  • 编写自定义代码,以查询每个数据库的应用程序接口
  • 浏览其独特的模式
  • 清理并将结果合并为一致的格式。

这不仅耗时、容易出错,而且需要研究人员核心领域之外的专业技术知识。

劳伦斯伯克利国家实验室的材料信息学科学家 Julia Ling 博士对此有切身体会。她说:

"在我的工作中,我经常需要整合来自多个数据库的数据,以便为我的机器学习模型建立全面的训练集。但这些数据库之间缺乏标准化是个大问题。在开始训练模型之前,我可能要花费数周时间编写数据处理脚本。

更糟糕的是,许多材料数据库被锁在个别研究小组或机构中,外部研究人员甚至无法找到,更不用说访问潜在的宝贵数据了。这种缺乏可见性和可访问性的情况阻碍了科学的发展,并造成了不必要的重复劳动。

Citrine Informatics 联合创始人兼首席科学官 Bryce Meredig 博士说:

"材料数据的现状一团糟。这些数据分散、杂乱,而且往往记录不全。 使得这些数据无法得到有效利用,尤其是在机器学习方面。

制定社区标准的必要性

为了克服这些挑战并在材料研究中充分利用人工智能,研究界需要一套通用的数据交换标准和协议。这些标准应允许研究人员以一致的方式访问和整合不同来源的数据、 机读 格式,而无需浏览每个数据库的复杂性。

这些标准必须由社区制定和通过 以开放和合作的方式.它们不能由任何单一机构或数据库提供商自上而下地强加。它们必须来自于学术界、工业界和政府的广泛利益相关者的共识和迭代过程。

这样做的好处显而易见。通过为材料数据交换提供通用语言和框架,它们可以减少数据访问和集成的障碍,让研究人员把更多时间花在科学研究上,减少处理数据的时间。此外,它们还能促成一个丰富的可互操作工具和服务生态系统,从数据可视化和分析平台到自动发现管道和知识库,不一而足。

劳伦斯伯克利国家实验室材料项目主任克里斯汀-佩尔松(Kristin Persson)博士说,社区标准是在材料科学中充分利用人工智能的关键。她补充道:

"通过商定一套通用的数据交换原则和协议,我们可以为材料研究领域的合作与创新开辟一个全新的领域。这不仅是为了让数据更容易获取,也是为了实现以前不可能实现的新科学"。

OPTIMADE 的崛起

一群领先的材料数据库和软件供应商看到了材料数据交换社区标准的需求,于 2016 年联合发起了 "材料设计开放数据库集成(OPTIMADE)"倡议。

OPTIMADE 的目标是开发一个通用的应用程序接口(API)规范,用于以标准化、机器可读的格式从材料数据库中查询和检索数据。通过为众多数据库提供单一接口,OPTIMADE 可以 无论研究人员使用何种数据库或软件,OPTIMADE 都能让他们更轻松地访问材料数据并将其整合到工作流程中。

OPTIMADE 规范基于 RESTful 网络设计,使用标准 HTTP 协议和 JSON 数据格式,实现数据库与客户端应用程序之间的通信。它定义了一套通用端点和查询参数,数据库可通过这些端点和参数,以标准化、自描述的方式公开其数据。

例如,客户端应用程序可以向符合 OPTIMADE 标准的数据库发送简单的 HTTP GET 请求,并以标准格式提供查询参数,以搜索含铁和氧的材料。

然后,数据库服务器将其 拥有 客户端应用程序可以使用标准工具和库解析和处理这些结果,而无需了解底层数据库模式或实施细节。然后,客户端应用程序就可以使用标准工具和库解析并处理这些结果,而无需了解底层数据库模式或实施细节。

行动中的 OPTIMADE

自 2019 年以来,OPTIMADE 已 被采纳 许多材料数据库和软件工具都可以提供。

其中一个例子是材料项目,这是一个由劳伦斯伯克利国家实验室主办的计算材料特性的流行数据库。2020 年,材料项目团队实施了 OPTIMADE API,这样用户就可以使用标准查询参数和响应格式访问其庞大的数据集。

首席数据库架构师 Shyam Dwaraknath 博士说:

"材料计划的 OPTIMADE API 改变了我们用户的游戏规则。它促成了一个全新的工具和集成生态系统,使我们比以往任何时候都更容易访问和分析从 Jupyter 笔记本和网络应用程序到高通量筛选管道的数据"。

NOMAD Archive 是高通量材料模拟原始数据的存储库,也是 OPTIMADE 的另一个早期采用者。通过 OPTIMADE API 公开其数据,NOMAD 使研究人员能够进行大规模数据挖掘,并在庞大的计算特性数据集上训练机器学习模型。

弗里茨-哈伯研究所(Fritz Haber Institute)小组组长、材料科学领域的人工智能爱好者 Luca Ghiringhelli 博士说:"我们的目标是,在我们的研究领域中,将人工智能和材料科学结合起来:

"我们看到,人们对数据驱动型材料研究的兴趣正在真正激增,而 OPTIMADE 正在其中发挥关键作用。通过为多个数据库提供单一界面,OPTIMADE 降低了数据访问和整合的门槛,有助于实现该领域的民主化。

实际应用

OPTIMADE 的影响已经体现在 被看见 从电池和可再生能源到航空航天和生物医学工程等众多材料研究领域。以下是几个实例,说明这种情况是如何发生的:

#1. 寻找高性能热电半导体:美国西北大学的研究人员利用 OPTIMADE 将来自多个计算数据库(包括材料项目和 OQMD)的数据结合起来,训练出一个机器学习模型,用于预测新材料的热电特性。利用这个数据集,他们找到了几种可能具有破纪录性能的新化合物,目前正在对它们进行合成和测试。

#2. 高通量筛选二维材料:丹麦科技大学的一个团队利用 OPTIMADE 从计算二维材料数据库(C2DB)中筛选出 50,000 多种计算二维材料。通过使用 OPTIMADE 过滤器查询数据库,他们能够快速找到具有特定性能(如高载流子迁移率或低带隙)的材料,用于下一代电子和光电技术。

#3. 新型电池材料的快速发展:麻省理工学院和斯坦福大学的研究人员利用 OPTIMADE 建立了一个电池材料性能中央数据库,该数据库结合了材料项目、OQMD 和其他来源的数据。他们在该数据集上训练了一系列机器学习模型,以预测新型锂离子电池化学成分的关键性能指标,如容量和循环性。这些模型目前正用于指导实验工作,为电动汽车和电网存储开发更安全、更持久、能量密度更高的电池。

#4. 高熵合金的设计:马里兰大学的一个研究小组利用 OPTIMADE 将来自多个计算和实验数据库(包括材料项目、OQMD 和高熵合金数据库 (THEAD))的数据结合起来,建立了一个高熵合金特性数据集。他们利用这个数据集来训练一个机器学习模型,以预测新的高熵合金成分的形成能和相稳定性。他们能够筛选出数千种候选材料,并找到最有希望通过实验验证的材料。这项工作有助于加速开发具有优异强度、韧性和耐腐蚀性能的下一代高熵合金,用于航空航天、国防等领域。

现在,让我们看看哪些公司能从这些标准的制定中获益最多。

#1. 特斯拉(TSLA)

特斯拉公司将从 OPTIMADE 的标准化数据交换中受益匪浅,这将增强其开发更好的电池技术和优化制造工艺中的材料的能力。这将帮助特斯拉生产出能量密度更高、寿命周期更长、安全性能更好的电池,同时还能降低成本,提高可持续发展能力。

特斯拉公司 (TSLA -5.15%)

从财务角度看,2023 年,特斯拉的营业收入为 $968 亿美元,比上一年增加了 19%,显示了其强劲的财务增长势头和持续创新的潜力。

#2. 英特尔公司(INTC)

另一家将从 OPTIMADE 的标准化数据交换中受益匪浅的公司是英特尔公司(INTC),它是技术和半导体领域的领军企业。利用人工智能和标准化材料数据,英特尔可以发现和设计新的半导体材料,从而开发出性能更好、效率更高、功能更新颖的芯片。

这将有助于英特尔保持其在半导体创新领域的领先地位。此外,整合各种数据库中的数据将简化英特尔的研发流程,从而将更多精力放在创新上,而不是数据管理上。

英特尔公司 (INTC -6.25%)

在财务方面,英特尔公布的 2023 年收入为 $54.2 亿美元,这反映了该公司在行业中的重要作用及其持续增长和发展的潜力。

OPTIMADE 的未来

因为 OPTIMADE 是 作为 采用 越来越多、 材料科学界正在探索数据整合和发现的新领域。 一个发展领域是将 OPTIMADE 与其他数据标准和本体论相结合,如欧洲材料建模本体论 (EMMO)和晶体学信息框架(CIF)。

统一这些不同的标准和语义,将使研究人员能够跨多个数据源、长度和时间尺度,提出更强大、更复杂的问题、 和材料科学领域。

未来研究的另一个重点领域是为材料数据分析和机器学习开发更先进的自动化工具。图神经网络和变压器架构等深度学习技术的兴起,预示着在这些模型中表示和处理材料数据需要标准化和可扩展的方法。

优化制造 地理位置优越 在这一领域发挥着关键作用,因为它可以提供一个通用界面,用于访问和整合大量不同的材料特性和结构数据集。正如弗里茨-哈伯研究所所长、计算材料科学的先驱马蒂亚斯-谢弗勒博士所言:"计算材料科学是一个非常重要的领域:

"OPTIMADE不仅仅是为了让数据更容易获取,更是为了实现材料发现和设计的新范式。通过为数据驱动和人工智能支持的材料研究提供基础,我们正在帮助开创一个创新和发现的新时代"。

展望未来,人们还有兴趣利用 OPTIMADE 启用更加分散和协作的数据共享模式,以及 材料发现. 例如,一些研究人员正在探索使用区块链创建安全的 OPTIMADE 数据库分布式网络,在该网络中,数据可以跨多个机构和领域共享和查询。

还有一些公司正在研究联合学习,以便在分散的数据集上训练机器学习模型,而无需集中或统一数据。通过允许 Matgenix 和 Data Science OÜ 等公司的研究人员跨机构合作并分享见解,同时还能控制他们的研究成果。 拥有 这些方法可以加快材料发现和创新的步伐。

点击这里了解为什么人工智能对思科系统公司来说是一个价值数十亿美元的游戏。

结束语

材料科学领域的人工智能和数据驱动技术正在改变我们发现、设计和应用新材料的方式。但要充分实现这些方法,我们必须 我们需要一个强大的标准化基础设施来访问和整合跨多个来源和领域的数据。

OPTIMADE 应用程序接口是实现这一点的关键因素,它提供了一种通用语言和协议,以机器可读的方式查询和检索材料数据。 格式。通过减少数据访问和整合的障碍,OPTIMADE 正在使材料研究更加民主,并加速创新。

随着 OPTIMADE 被越来越多地采用,数据驱动材料发现的新工具和新技术不断涌现,我们可以期待未来会出现更多的新技术。从新型电池材料和高性能合金到定制药物和功能纳米材料,未来的可能性是无限的。

但要实现这一目标,我们需要材料科学界的持续投资与合作,以及开放数据、开放标准和开放科学。只有通过跨学科和跨机构的合作,我们才有希望充分释放人工智能和数据驱动的力量。 材料科学的发现。

正如加州大学伯克利分校材料科学教授、计算材料设计先驱 Gerbrand Ceder 博士所说:

"未来是光明的,但我们需要改变对数据和协作的思维方式。通过使用像 OPTIMADE 这样的开放标准,并作为一个社区共同努力分享知识,我们可以加快创新,解决我们今天面临的一些最大问题。

总之,采用 OPTIMADE 等标准将通过简化数据集成、加强协作和推动多个行业的快速创新,彻底改变材料科学。

点击这里了解人工智能(AI)投资的所有信息。 

Gaurav 于 2017 年开始交易加密货币,从此爱上了加密货币领域。他对所有加密货币的兴趣让他成为了一名专门研究加密货币和区块链的作家。很快,他就发现自己与加密货币公司和媒体机构合作。他还是蝙蝠侠的忠实粉丝。

广告商披露:Securities.io 遵循严格的编辑标准,为读者提供准确的评论和评级。当您点击我们所评论产品的链接时,我们可能会收取报酬。

ESMA:差价合约是一种复杂的工具,由于杠杆作用而具有快速亏损的高风险。74-89% 的散户投资者账户在交易差价合约时会亏损。您应该考虑自己是否了解差价合约的工作原理,以及是否能够承受高亏损风险。

投资建议免责声明:本网站所含信息仅用于教育目的,不构成投资建议。

交易风险免责声明:证券交易的风险非常高。交易任何类型的金融产品,包括外汇、差价合约、股票和加密货币。

由于市场分散且不受监管,加密货币的这种风险更高。您应该意识到,您可能会损失您投资组合中的很大一部分。

Securities.io 不是注册经纪人、分析师或投资顾问。