由橡树岭国家实验室领导的能源部科学家团队发布了第一个将杨树微生物组的分子信息与生态系统水平过程联系起来的数据集。该项目旨在为有关自然系统如何发挥作用、其对气候变化的脆弱性的研究提供信息,并最终为如何将植物作为生物能源和天然碳储存的来源进行设计以获得更好的性能提供信息
《科学数据》中描述的数据提供了关于毛果杨27种基因不同变体或基因型的深入信息,毛果杨是一种生物能源作物
这些基因型是ORNL领导的生物能源创新中心之前纳入的一项全基因组关联研究中的基因型之一,该研究将遗传变异与树木的物理特征联系起来。ORNL的研究人员从俄勒冈州的两个地区的杨树田里收集了树叶、土壤和根系样本;一个在更潮湿、易受洪水影响的地区,另一个在干燥、易受干旱影响的地区
新整合的数据集中的详细信息包括树木的基因构成和基因表达、土壤环境的化学、对树木上和周围微生物的分析以及植物和微生物产生的化合物
ORNL公司研究员、生物成像和分析部门负责人兼项目联合负责人Mitchel Doktycz表示,该数据集“在规模和范围上都是前所未有的”。“它在回答许多不同的科学问题方面很有价值。”他说,通过使用机器学习和统计方法挖掘数据,科学家可以更好地了解杨树的遗传组成、物理特征和化学多样性与土壤氮和碳循环等过程的关系
ORNL生态系统过程小组组长、该项目的合作者Melanie Mayes说:“我们从这一植物中获得的知识将被重新用于用白杨生产生物燃料的项目。”。“我们在这里建立的程序将用于其他植物的生物工程,并帮助我们建立气候适应性,即提高土壤碳储量和减少温室气体排放。”
完整的数据集包括超过25 TB。这些数据的链接是国家微生物组数据合作组织(NMDC)的一部分,该组织是美国能源部的一项倡议,支持微生物组与环境过程关联的数据共享
项目联合负责人、ORNL杰出科学家Christopher Schadt表示:“该数据集代表了树木内层上最大的公开宏基因组学存储库”,植物组织环境是复杂微生物群落的家园
对样本的详细分析产生了318个宏基因组,通过基因测序揭示了生活在树木中及其周围的微生物的多样性。九十八个植物转录组提供了有关植物根中表达的信使核糖核酸分子的全方位信息。该数据集包括314个代谢组学图谱,提供了植物和微生物在生长或应对压力时产生的小分子的信息
还包括相关土壤物理和生物地球化学特征的数据,检查存在的化学物质及其如何在环境中循环
整合这些“多组学”数据将为研究植物相关分子和细胞事件如何与生态系统过程和行为联系的科学家提供重要信息
了解植物、土壤氮循环触发因素劳伦斯伯克利国家实验室的美国能源部科学办公室用户设施联合基因组研究所是该项目的密切合作者。JGI领导了叶、根和土壤环境或根际的代谢组学分析、植物根转录组学测序以及土壤根际和内层宏基因组学工作该项目最初是一个名为Bio-Scales的ORNL试点项目,由美国能源部科学办公室生物与环境研究项目的生物系统科学部支持。Bio-Scales致力于更好地理解植物与微生物的关系,重点关注氮循环。氮是生命的基本营养素,但如果在农业和其他应用中过度使用,它可能会损害水质,或作为强效温室气体一氧化二氮(N2O)排放
“该项目需要整合许多不同的专业知识,”Doktycz说。“一开始,一个团队在新冠肺炎期间外出收集了所有这些不同的材料,并将其带回实验室,然后准备、分析并从中提取数据。我们还有一个令人难以置信的技术支持团队,他们以跟踪和协调的方式处理了数百个样本,并与联合基因组研究所进行序列分析。”;提供准确的细节,例如采样地点和方式,以及后续数据报告的标准格式。将这些元素添加到数据中使信息更易于查找、理解和重用ORNL的Stanton Martin与NMDC密切协调领导了该项目的数据管理,他指出,数据优先的方法支持人工智能和其他分析方法,以帮助解决科学问题
“我们在该项目中执行的数据管理对Plant Micr等其他项目的数据实践非常有价值
Journal information: Scientific Data
Provided by Oak Ridge National Laboratory
2024-09-15
2024-09-15
2024-09-15
2024-09-15
2024-09-15