新方法使人工智能适应作物育种中的计算机视觉

Scientists developed a machine-learning tool that can teach itself, with minimal external guidance, to differentiate between aerial images of flowering and nonflowering grasses—an advance that will greatly increase the pace of agricultural field research,

科学家们开发了一种机器学习工具,可以在最少的外部指导下自学区分开花和不开花草的航拍图像,他们说,这一进步将大大加快农业田间研究的步伐。这项工作是使用数千种芒草的图像进行的,每种芒草都有自己的开花特征和时间。伊利诺伊大学厄巴纳-香槟分校植物生物学和作物科学教授Andrew Leakey表示,在生长周期的不同点,准确区分不同条件下的作物性状是一项艰巨的任务。他与Leakey领导的高级生物能源和生物产品创新中心的科学家Sebastian Varela领导了这项新工作。Leakey说,这种新方法应该适用于许多其他作物和计算机视觉问题。

这些发现发表在《植物生理学》杂志上。Leakey说:“开花时间是影响生产力和包括芒在内的许多作物适应不同生长地区的关键性状。”。“但是,对在广泛的田间试验中种植的数千株单株植物进行重复的目视检查是非常劳动密集型的。”

通过无人机收集图像并使用人工智能从这些图像中提取相关数据来自动化这一过程,可以简化这一过程并使其更易于管理。但是,Leakey说,构建能够区分复杂图像中细微特征的人工智能模型通常需要大量的人类注释数据。“生成这些数据非常耗时。深度学习方法往往非常依赖于上下文。”

他说,这意味着当上下文发生变化时,例如,当模型必须区分不同作物或同一作物在一年中不同位置或时间的特征时,可能需要使用反映这些新条件的新注释图像对其进行重新训练。

“有很多例子表明,人们已经提供了使用人工智能加速传感器技术(从叶片传感器到卫星)在育种、土壤和作物科学中的应用的概念证明,但它现在并没有被广泛采用,或者没有像你希望的那样被广泛采用。我们认为其中一个主要原因是训练人工智能工具需要付出巨大的努力,”Leakey说。

为了减少对人类注释训练数据的需求,Varela转向了一种众所周知的方法,促使两个AI模型在所谓的“生成对抗网络”(GAN)中相互竞争。GAN的一个常见应用是,一个模型生成所需场景的假图像,另一个模型检查图像以确定哪些是假的,哪些是真的。

随着时间的推移,这些模型会相互改进,瓦雷拉说。模型一生成了更逼真的假图像,模型二在区分假图像和真实图像方面做得更好。

在此过程中,模型获得了特定主题的视觉专业知识,使他们能够更好地解析遇到的任何新图像的细节。瓦雷拉假设,他可以利用这种自我生成的专业知识来减少训练模型区分许多不同作物所需的带注释图像的数量。在这个过程中,他创建了一个“高效监督的生成和对抗网络”,或ESGAN。

在一系列实验中,研究人员根据现有的人工智能训练协议测试了他们的ESGAN的准确性。他们发现,与“传统的完全监督学习方法”相比,ESGAN“将人类注释数据的需求降低了一到两个数量级”。注册我们的免费时事通讯,每天或每周获取重要突破、创新和研究的最新进展。

研究人员报告称,新发现表明,开发和使用定制训练的机器学习模型来确定“涉及其他地点、繁殖种群或物种”的开花时间所需的努力大大减少。“这种方法为克服生物学和数字农业其他领域的类似挑战铺平了道路。”Leakey和Varela将继续与芒育种家Erik Sacks合作,将新方法应用于多州芒育种试验的数据。该试验旨在开发适合区域的芒属植物,这些芒属植物可用作原料,在目前无法耕种的土地上生产生物燃料和高价值生物产品。Leakey说:“我们希望我们的新方法可以被其他人用来简化人工智能工具在作物改良中的应用,涉及更广泛的性状和物种,从而有助于广泛支持生物经济。”。

Leakey是美国卡尔·R·乌斯基因组生物学研究所、可持续发展、能源与环境研究所和数字农业中心的教授