普林斯顿大学的研究团队开发了一种人工智能(AI)工具,该工具利用大型语言模型预测晶体材料的性质,对于推进电池和半导体等技术的进步至关重要。这项创新不仅改变了我们对材料科学的认知,还为更广泛的应用领域打开了新的可能性。
传统上,计算机模拟在晶体设计过程中发挥着重要作用。然而,新方法采用了一种全新的策略,通过大型语言模型进行预测,这与为ChatGPT等文本生成器提供动力的模型类似。这种模型在处理文本数据方面表现出色,能够整合各种信息,包括原子间的键长和键角以及电子和光学性质的测量数据。
研究人员创建了一个包含14万多种晶体描述的文本基准,并使用这个基准训练了一个改进版本的T5大型语言模型。T5最初由谷歌研究团队开发。通过测试该工具对已知晶体结构的性质预测能力,研究人员展示了其强大的性能,从常见的食盐到硅半导体等广泛的应用场景。
这项研究于11月29日在波士顿的材料研究学会秋季会议上进行了展示。据普林斯顿大学计算机科学助理教授、研究的高级作者Adji Bousso Dieng表示,这一创新基准有望加速广泛领域内的材料发现过程。
概述这种方法的论文“LLM-Prop:从晶体文本描述预测物理和电子性质”已发布在arXiv预印本服务器上。该论文详细介绍了这种方法如何利用大型语言模型的强大功能来预测晶体材料的性质。
传统的基于AI的晶体性质预测工具依赖于图神经网络方法,但这些方法在计算能力上有限制,难以充分捕捉晶体中原子间键的几何形状和长度的细微差别以及由此产生的电子和光学性质。Dieng的团队是首个利用大型语言模型解决这一挑战的研究团队。
Dieng指出:“我们在计算机视觉和自然语言处理方面取得了巨大进步,但在处理图形方面还不够先进。”她认为,通过将研究重心从图形转移到已经拥有强大工具处理的文本领域,可以克服这一挑战。
该研究的合著者、普林斯顿大学机械和航空工程学教授、创新副院长Craig Arnold表示:“基于语言模型的方法为设计材料问题提供了一个全新的视角。”他认为,这种方法与当前的方法有着本质的不同,其强大之处在于如何利用人类开发的所有知识来推动科学进步。
总而言之,普林斯顿大学的研究团队通过开发基于大型语言模型的人工智能工具,为材料科学领域带来了革命性的变革。这一创新不仅加速了新材料的发现和设计过程,还为未来更广泛的应用领域开辟了新的可能性。随着技术的不断进步,我们有望见证更多类似的突破性研究,推动人工智能在材料科学和其他领域的更深层次应用和发展。