长非编码RNA(lncRNA)是一种普遍存在的转录物,在各种生物过程中具有关键的调控作用,包括染色质重塑、转录后调控和表观遗传学修饰。尽管越来越多的证据阐明了植物lncRNA调节生长、根系发育和种子休眠的机制,但由于缺乏植物特异性方法,其准确鉴定仍然具有挑战性
目前,植物lncRNA鉴定的主流方法主要是基于人类或动物数据集开发的。因此,这些方法在预测植物lncRNA方面的准确性和有效性尚未得到充分评估
最近,北京林业大学的毛建峰和Umeå领导的一个小组发表了一篇题为《植物LncPipe:一个在植物lncRNA鉴定方面提供重大改进的计算管道》的研究文章;大学发表在《园艺研究》杂志上
本研究广泛收集了来自各种植物的高质量RNA测序数据,并利用这些植物特异性数据重新训练了三种主流lncRNA预测工具的模型,即CPAT、LncFinder和PLEK。将重新训练的模型的性能与其他流行的lncRNA预测工具(如CPC2、CNCI、RNAplonc和LncADeep)进行比较和评估
结果表明,重新训练的模型显著提高了植物lncRNA的预测性能。其中,两个重新训练的模型,LncFinder植物和CPAT植物,在多个评估指标上优于其他模型,使其成为最适合植物lncRNA鉴定的工具
这项研究开发了一个名为Plant LncPipe的计算管道,用于识别和分析植物lncRNA
该管道集成了两个性能最佳的鉴定模型,CPAT工厂和LncFinder工厂,实现了一个全面的计算过程,包括原始数据预处理、转录物组装、lncRNA鉴定、lncRNA-分类和lncRNA起源。这种计算管道可以广泛应用于各种植物物种。Plant LncPipe是公开的
该研究表明,在高质量的植物转录组数据上重新训练lncRNA预测模型能够更准确地捕捉植物lncRNA特征,显著提高预测的准确性和可靠性。该研究强调了针对特定物种的再培训对提高模型准确性的重要性。对现有成熟模型的再培训保留了先前积累的经验和方法,同时进一步提高了模型的适用性和准确性
Journal information: Horticulture Research
Provided by Chinese Academy of Sciences
2024-09-15
2024-09-15
2024-09-15
2024-09-15
2024-09-15