水稻(Oryza sativa L.)是养活全球一半以上人口的重要作物。对高质量、富含蛋白质的水稻的需求正在增加,这使得准确的谷物蛋白质含量(GPC)估计对于培育优质品种至关重要
尽管GWAS等基因组工具取得了进展,但传统表型仍然是劳动密集型和昂贵的,造成了瓶颈。光学和光谱成像的最新发展提供了高通量表型分析解决方案。然而,小而不平衡的数据集限制了模型的性能和泛化能力
发表在《植物表型学》上的一项研究旨在通过使用DCGAN生成模拟数据来解决这些问题,提高GPC模型的准确性,并探索基因解剖的潜力
该研究利用高光谱数据和DCGAN来改进水稻GPC的估计。原始和归一化的光谱数据揭示了对GPC分析至关重要的不同吸收特征。DCGAN在8000个历元后生成的模拟数据与实测数据紧密匹配,提高了模型的准确性
使用这些特征的偏最小二乘回归(PLSR)模型实现了高验证精度(R2=0.58,RRMSE=6.70%)
此外,利用模拟数据进行的全基因组关联研究(GWAS)分析确定了显著的SNPs,包括与谷物贮藏蛋白相关的OsmtSB1L基因
这种方法展示了高泛化GPC模型的潜力,有助于水稻品种的高级遗传分析和育种
根据该研究的首席研究员郑恒标的说法,“这项研究为基于高光谱技术的水稻表型性状的高效遗传研究提供了一种新技术。”
展望未来,在不同的生态位点和更广泛的数据集上进行进一步的细化和验证将增强该方法的稳健性和适用性,为更精确、高效地培育优质水稻品种铺平道路
More information: Hengbiao Zheng et al, Grain Protein Content Phenotyping in Rice via Hyperspectral Imaging Technology and a Genome-Wide Association Study, Plant Phenomics (2024). DOI: 10.34133/plantphenomics.0200Provided by Chinese Academy of Sciences
2024-09-15
2024-09-15
2024-09-15
2024-09-15
2024-09-15