在微生物组数据中识别稀有微生物变得更加容易。来自葡萄牙和加拿大的一组研究人员开发了一种新工具,该工具使用机器学习自动检测生态数据集中的稀有生物圈
目标是快速、自主和无监督地识别微生物组数据集中的稀有微生物。这个名为ulrb的新工具回应了微生物生态学中一个长期存在的挑战:区分稀有微生物和自然环境中最丰富的微生物
新方法和新的ulrb软件现已发表在《通讯生物学》杂志的“通过无监督机器学习定义微生物稀有生物圈”研究中
这篇论文是海洋与环境研究跨学科中心(CIIMAR)、波尔图大学理学院、里斯本大学高等技术学院生物工程与生物科学研究所(iBB)、渥太华大学电气工程与计算机科学学院(EECS)和达尔豪斯大学计算机科学学院在加拿大的国际合作成果
这是CIIMAR学生Francisco Pascoal在CIIMAR研究员Catarina Magalhães的监督下,在研究人员Rodrigo Costa(iBB)和Paula Branco(EECS)的共同监督下进行的博士项目的成果
这款新软件不仅将提高不同微生物组和生态系统的生态分析的准确性,还将提高这些分析的深度,最终提高我们对微生物多样性及其在生态系统恢复力中的作用的理解
什么是罕见的生物圈微生物群落通常遵循一种模式,即只有少数物种高度丰富,而绝大多数物种的丰度较低,属于所谓的“稀有生物圈”。事实上,有数千种原核微生物可以栖息在1升海水中。然而,这些物种中只有2%到5%是丰富的,而其余的则很少见,由于方法的限制,很难检测和识别
虽然它们不是很丰富,但稀有物种拥有地球上最大的遗传多样性。它们有责任为生态系统提供强大的弹性。帕斯科解释说:“如果最丰富的物种受到气候变化的威胁,其他稀有物种可以接管并确保微生物组的功能,保持生态系统的稳定。”
因此,稀有生物圈在生态系统对环境重大变化(如气候变化的影响)的反应中起着非常重要的作用。研究稀有生物使我们能够了解生态系统对这些变化的适应能力,并研究它们对环境变化的反应 ulrb的创新通过采用无监督的机器学习技术,ulrb使研究人员能够快速可靠地识别社区中的稀有微生物。这种方法的一个主要优点是它对不同方法背景的适应性,即算法“学习”数据本身中存在的模式,而不管其来源如何与超过100000名依赖Phys.org获取日常见解的订阅者一起探索科学、技术和太空的最新进展。注册我们的免费时事通讯,每天或每周获取重要突破、创新和研究的最新进展
“随着高通量DNA测序技术的发展,鉴定稀有微生物的可能性出现了,但即使有了这些数据,同行们也从未清楚如何鉴定稀有微生物,因为它们被丰富的微生物所掩盖。因此,许多研究人员仅限于建立随机丰度水平,这是一种不够的方法,因为它没有生物学依据的支持。
”通过这种新方法,我们能够根据每个样本中提供的信息,使用测序数据自动区分哪些微生物是稀有的,“该研究的第一作者Pascial说。
为了自动化这一过程,创建了一种算法,将给定样本中丰度最相似的微生物分组在一起。由于它基于它们之间的相对距离,因此可以自动化并应用于任何规模的数据库,并产生具有严格和统一生态和生物价值的结果。
”基本上,该算法“学习”了群落中的丰度组,并将其与丰度分类相匹配,这使得区分稀有微生物和丰富微生物成为可能,Pascoal说。
可能的应用ulrb可以应用于从常见微生物生态学协议中获得的数据,并可用于研究新出现的疾病和生物入侵。由于这种方法可以应用于非微生物数据,因此它也可以用于确定在某些情况下哪些动物和/或植物物种面临风险,这对环境监测很有用。
如果你是一名研究人员,想将这个工具应用于你自己的数据,ulrb可以在CRAN和GitHub上作为开源R包提供。研究人员团队还创建了一个有学习材料的网站,鼓励你使用这个工具
Journal information: Communications Biology
Provided by Interdisciplinary Centre of Marine and Environmental Research
2025-04-20
2025-04-20
2025-04-20
2025-04-20
2025-04-20