大麻泛基因组揭示其药用与工业应用潜力

科学家们分析了近200个大麻基因组,创建了迄今最全面、高质量且详尽的植物遗传图谱。该图谱揭示了该物种前所未有的多样性和复杂性,为基于大麻的农业、医药及工业发展奠定了基础,并延续了人类与大麻长达万年的共生关系,表明大麻可成为与玉米或小麦同等重要的作物。

索尔克研究所的研究人员创建了迄今为止最全面、高质量且详尽的大麻基因图谱。该团队分析了193种不同大麻基因组(完整的遗传信息集合),揭示了这一基础农业物种前所未有的多样性、复杂性和未开发潜力。这项里程碑式成果是与俄勒冈CBD公司、俄勒冈州立大学以及HudsonAlpha生物技术研究所多年合作的结晶。

2025年5月28日发表于《自然》杂志的研究成果,为基于大麻的农业、医药和工业领域突破性进展奠定了基础。

"大麻是地球上最非凡的植物之一。尽管过去至少一万年间它作为药物、食物、籽油和纤维的全球重要性,但仍是现代最欠开发的主要作物之一,这主要源于长达一个世纪的法律限制,"该研究资深作者、索尔克研究所教授Todd Michael表示,"我们团队通过分析近200个多样化大麻基因组,构建了迄今最完整的植物遗传图谱(泛基因组),表明我们才刚刚开始看到这种神奇植物的全部潜力。那些法律限制反而催生了地下育种革命,揭示了大麻作为化学工厂的强大能力。借助这份新基因组蓝图,我们现在可以运用现代育种技术来解锁农业、医药和生物技术领域的新化合物与性状。"

背景:大麻作为化学能量站

大麻(Cannabis sativa)又称汉麻,原产于亚洲的开花植物。其诸多独特特性使其在人类历史上成为重要作物,如能生产纺织用强韧纤维,或是作为少数能大量合成大麻素的植物所具有的药用价值。当今创新者提出,通过适当育种,大麻油可与菜籽油或大豆油媲美,其衍生物甚至可作为航空燃料的可持续替代品。

大麻是化学合成的强者。其干重30%以上可产出萜烯和大麻素——这些植物用于抵御捕食者的小分子化合物,却被人类用于调节情绪。萜烯产生吸引我们关注花果的精致芳香,而大麻素则通过与人体相互作用提供多种治疗特性。当"夏洛特网"品系被用于治疗癫痫发作时,非精神活性的大麻二酚(CBD)改变了公众对大麻的认知。CBD、四氢大麻酚(THC)及100多种尚未充分研究的大麻素已被用于治疗疼痛、关节炎、恶心、哮喘、抑郁和焦虑等多种疾病。

 

关键在于,这种选择性育种对大麻基因组多样性的影响始终成谜。由于大麻基因组复杂,破解这一谜题颇具挑战性。首先,大麻属于不足5%的雌雄异株植物。其次,其基因组含大量转座因子——这些能在基因组中"跳跃"的重复DNA片段难以追踪。

关键发现:新颖且惊人的遗传多样性模式

科学家使用测序技术测定核酸模式,这些核酸连接DNA双螺旋形成碱基对。传统短读长测序方法将DNA切碎后逐段分析,每次仅能读取几百个碱基对。新型长读长测序技术可一次性捕获数千碱基对。

"短读长测序技术存在发现局限,当研究基因组复杂区域(尤其是重复DNA序列)时,这些短基因片段无法以有意义方式拼接,"共同第一作者、Michael实验室博士后Lillian Padgitt-Cobb解释,"我们属首批在泛基因组层面大规模应用长读长技术的研究者,由此获得了关于结构变异和基因排序的全新认知,这些可指导培育优良大麻性状的终极决策。"

该研究并非首个应用长读长测序的案例——事实上Michael本人早在2018年就率先利用该技术完成大麻染色体级别基因组测序,揭示了合成大麻素的复杂遗传结构,并阐释了抗癫痫品系"夏洛特网"的育种历史。本研究的突破在于其完整性:包含迄今最多基因组,首次纳入性染色体,并首次实现单倍型分辨率。

大麻是二倍体植物。与人类相似,其包含两套染色体,分别来自父本和母本。尽管此前公布的基因组大多只能解码一条染色体(即单倍型分辨率),该团队同时解析了两套大麻染色体。通过观察双套染色体,研究人员发现了超乎想象的遗传变异——可能高达人类的20倍。

 

"通过这种单倍型分辨率,"Padgitt-Cobb解释道,"我们可以追踪单亲本遗传信息,进而理解该植物的育种背景。"

研究团队收集全球144株大麻的基因组,最终组装193个基因组——其中181个属首次编目。基因组数量超过植株数量源于单倍型分辨率,因为每株被测序双套染色体的植物会产生两个基因组组装。这些基因组共同构成泛基因组,通过分析可理解大麻物种遗传多样性的全貌。

高质量基因组使研究人员能解析前所未见的遗传模式,包括大麻素合成相关基因结构,以及通过纳入性染色体首次观察到的大麻Y染色体。

首要发现是该物种存在意外多样性:泛基因组中23%基因存在于所有样本,55%近乎普遍存在(见于95%-99%样本),21%出现于5%-94%样本,不足1%完全独特。最普遍的基因中包含大麻素合成基因。

虽然大麻素基因在基因组间高度一致,但脂肪酸代谢、生长和防御相关基因则不然。这些变异基因是尚未开发的育种资源,其选择性培育可增强大麻田间抗性,或提升汉麻油营养价值以抗衡现有植物油。值得注意的是,研究团队发现脂肪酸生物合成通路的结构变异导致四氢大麻苊酚(THCV)的产生,这种稀有varin型大麻素因其非精神活性的振奋作用正受到关注。

深入研究泛基因组中大麻素基因后,研究人员得出结论:THCAS和CBDAS两个基因可能正承受人为选育THC和CBD含量的强选择压力。重要的是,他们发现大麻素基因位于转座因子内。对这些"跳跃"转座因子内基因的选择性育种,反过来造就了大麻植株间的巨大多样性。

展望:优化健康与工业用植物

研究人员还确定了农业优化的重要目标。首先,通过比较欧亚基因组差异,他们推断亚洲某处可能存在待发现的远古大麻近缘种。这个野生近缘种将具备独特环境历史塑造的新遗传适应性,为培育更具韧性的作物提供丰富信息。

最后,对性染色体的新见解揭示:仅存在于"父本"的基因可用于培育性能更优的后代。现代大麻育种采用"雌化"技术,即诱导雌株产生雄花——完全绕过Y染色体。这些新发现表明,育种计划可能错过了那些被绕过的雄株基因组所编码的宝贵遗传多样性和性状潜力。将真实雄株纳入育种策略,可解锁被忽视的遗传增益并拓展作物改良机会。

"过去十年育种者已在提高产量方面取得显著成效,使大麻成为经济可行的作物,"共同第一作者、Michael实验室博士后Ryan Lynch表示,"随着市场兴趣的增长,配合这些能指导育种工作的新基因组认知,我认为汉麻及其油料将在人类健康和工业应用领域真正蓬勃发展。"

短期内,研究团队希望该泛基因组能成为全球研究人员的动态资源库,用于制定种植策略,助力实现大麻作为纤维、籽油和药物多用途作物的未开发潜力。