一个长期存在的问题使救命药物被搁置一边,阻碍了下一代电池的发展,并使考古学家无法确定古代文物的起源。
100多年来,科学家们一直使用一种称为晶体学的方法来确定材料的原子结构。该方法通过将X射线束照射到材料样品中并观察其产生的图案来工作。从这个图案——称为衍射图案——理论上可以计算出样品中原子的精确排列。
然而,挑战在于,这种技术只有在研究人员拥有大而纯的晶体时才能很好地工作。当他们不得不满足于一种由微小碎片组成的粉末——称为纳米晶体——这种方法只暗示了看不见的结构。
哥伦比亚工程公司的科学家们创建了一种机器学习算法,可以观察纳米晶体产生的模式来推断材料的原子结构,正如《自然材料》杂志上发表的一项新研究所述。
在许多情况下,他们的算法从高度退化的衍射信息中实现了原子尺度结构的近乎完美的重建——这是几年前无法想象的壮举。
哥伦比亚工程学院材料科学、应用物理学和应用数学教授Simon Billinge说:“人工智能通过从数千个已知但无关的结构数据库中学习一切,解决了这个问题。就像ChatGPT学习语言模式一样,人工智能模型学习了自然界允许的原子排列模式。”
晶体学改变了科学晶体学对科学至关重要,因为它是理解几乎任何材料特性的最有效方法。这种方法通常依赖于一种称为X射线衍射的技术,在这种技术中,科学家向晶体发射高能光束,并记录它产生的亮点和暗点的图案,有点像阴影。
当晶体学家使用这种技术分析大型纯样品时,产生的X射线图案包含了确定其原子级结构所需的所有信息。该方法以发现DNA的双螺旋结构而闻名,为医学、半导体、储能、法医学、考古学和数十个其他领域的研究开辟了重要途径。
不幸的是,研究人员通常只能获得粉末或悬浮在溶液中的非常小的晶粒或原子团的样品。在这些情况下,X射线模式包含的信息要少得多,对于研究人员来说,使用现有方法确定样品的原子结构太少了。
AI将该方法扩展到纳米粒子该团队在40000个已知原子结构上训练了一个生成性AI模型,以开发一个能够理解这些劣质X射线模式的系统。这种被称为扩散生成建模的机器学习技术起源于统计物理学,最近因支持Midjourney和Sora等人工智能生成的艺术程序而臭名昭著。
与超过100000名依赖Phys.org获取日常见解的订阅者一起探索科学、技术和太空的最新进展。注册我们的免费时事通讯,每天或每周获取重要突破、创新和研究的最新进展。“从之前的工作中,我们知道纳米晶体的衍射数据不包含足够的信息来产生结果,”Billinge说。“该算法利用其对数千个无关结构的了解来增强衍射数据。”
为了将该技术应用于晶体学,科学家们从40000个晶体结构的数据集开始,将原子位置混淆,直到它们与随机放置无法区分。然后,他们训练了一个深度神经网络,将这些几乎随机放置的原子与其相关的X射线衍射图案连接起来。
网络利用这些观测结果重建了晶体。最后,他们将人工智能生成的晶体通过一种称为Rietveld精化的程序,该程序根据衍射图案将晶体“抖动”到最接近的最佳状态。
尽管该算法的早期版本举步维艰,但它最终学会了比研究人员预期的更有效地重建晶体。该算法能够从各种形状的纳米级晶体中确定原子结构,包括之前实验难以表征的样品。
“粉末晶体学挑战是著名的蛋白质折叠问题的姊妹问题,其中分子的形状间接来自线性数据签名,”哥伦比亚工程学院机械工程系主任、James and Sally Scapa创新教授Hod Lipson说,他与Billinge共同提出了这项研究。
“特别让我兴奋的是,在物理学或几何学背景知识相对较少的情况下,人工智能能够学会解决一个困扰人类研究人员一个世纪的难题。这是许多其他领域面临长期挑战的一个迹象。”
这个有着百年历史的粉末晶体学难题对Lipson来说尤其有意义,他是Henry Lipson CBE FRS(1910-1991)的孙子,Henry Lipson是计算晶体学方法的先驱。
在20世纪30年代,亨利·利普森与布拉格和其他同时代人合作,开发了早期的数学技术,这些技术被广泛用于求解第一个复杂的分子,如青霉素,从而获得了1964年的诺贝尔化学奖。
Gabe Guo,BS'24,目前是斯坦福大学的博士生,在哥伦比亚大学读大四时领导了这个项目,他说:“当我在中学的时候,这个领域正在努力构建可以区分猫和狗的算法。现在,像我们这样的研究强调了人工智能在增强人类科学家的能力和将创新加速到新水平方面的巨大力量。”
Journal information: Nature Materials
Provided by Columbia University School of Engineering and Applied Science
2025-06-21
2025-06-21
2025-06-21
2025-06-21