大麻泛基因组揭示药用及工业应用潜力

科学家分析了近200个大麻基因组,创建了迄今最全面、高质量、详细的植物基因图谱。该图谱揭示了该物种内部前所未有的多样性和复杂性,为基于大麻的农业、医药和工业发展奠定了基础,并延续了人类与大麻长达一万年的历史关系,证明大麻可以像玉米或小麦等其他作物一样重要。

索尔克研究所的研究人员创建了迄今为止最全面、高质量且详细的大麻遗传图谱。该团队分析了193个不同的大麻基因组(全套遗传信息),揭示了这个基础农业物种前所未有的多样性、复杂性和未开发的潜力。这一里程碑式的成就是与俄勒冈CBD公司、俄勒冈州立大学和HudsonAlpha生物技术研究所多年合作的结果。

这些发现于2025年5月28日发表在《自然》杂志上,为基于大麻的农业、医药和工业领域的变革性进步奠定了基础。

“大麻是地球上最非凡的植物之一。尽管在至少过去10,000年里,它作为药物、食物、籽油和纤维的来源具有全球重要性,但它仍然是现代最不发达的主要作物之一,这在很大程度上要归因于长达一个世纪的法律限制,”该研究的资深作者、索尔克研究所研究教授托德·迈克尔说。“我们的团队通过分析近200个不同的大麻基因组,构建了迄今为止最完整的植物遗传图谱或泛基因组,这表明我们才刚刚开始认识到这种神奇植物的全部潜力。正是这些法律限制催生了一场地下育种革命,揭示了大麻作为化学工厂的强大能力。有了这个新的基因组蓝图,我们现在可以应用现代育种技术,在农业、医学和生物技术领域解锁新的化合物和性状。”

背景:大麻作为化学动力工厂

Cannabis sativa(大麻),也称为汉麻,是一种原产于亚洲的开花植物。大麻具有许多独特的特性,使其在人类历史进程中成为一种重要作物,例如它能够生产用于纺织品的强韧纤维,或者其药用品质源于它是少数能大量合成大麻素的植物之一。当今的创新者认为,通过适当的育种,大麻油可以与菜籽油或大豆油相媲美,甚至大麻衍生物可以用作航空燃料的可持续替代品。

大麻是一个化学动力工厂。其干重中超过30%可以是由萜烯和大麻素组成——这些是植物为抵御捕食者而产生的小分子化学物质,但人类却利用它们来改变情绪。萜烯产生吸引我们去接触水果和花卉的精美香气,而大麻素则与人体相互作用,提供多种治疗特性。一种名为非精神活性的大麻二酚(CBD)的大麻素,在“夏洛特网株”被用于治疗癫痫发作后,拓宽了公众对大麻的看法。CBD、四氢大麻酚(THC)以及100多种其他研究较少的大麻素已被用于治疗多种疾病,包括疼痛、关节炎、恶心、哮喘、抑郁和焦虑。

 

重要的是,这种选择性育种对大麻基因组多样性的影响一直是个谜。解开这个谜团已被证明困难重重,因为大麻拥有复杂的基因组。首先,大麻属于少于5%的雌雄异株植物(即雌雄性别存在于不同植株上)。其次,大麻基因组含有许多转座元件,这些是可以“跳跃”到基因组不同位置的重复DNA片段,因此难以追踪。

关键发现:新颖且令人惊讶的多样化遗传模式

科学家使用一种称为测序的技术来确定核酸的模式,这些核酸在DNA的双螺旋结构中连接形成碱基对,沿着DNA链排列。传统的短读长测序方法将DNA切碎,每次只研究一小段,通常只有几百个碱基对。更新的长读长测序技术可以一次性捕获数千个碱基对。

“短读长测序技术能发现的东西是有限的,因为当观察基因组的复杂区域,特别是重复DNA序列时,那些短的遗传片段不可能以任何有意义的方式拼接起来,”共同第一作者、迈克尔实验室的博士后研究员莉莲·帕吉特-科布说。“我们是在泛基因组背景下大规模利用这种长读长技术的先驱之一,随之而来的是对所有结构变异和基因排序的洞察,这些可以为将优良性状培育到大麻植物中的育种决策提供关键依据。”

这项研究并非首次使用长读长测序——事实上,迈克尔本人在2018年就率先利用长读长测序生成了大麻的染色体级别基因组,揭示了合成大麻素的复杂遗传结构,并解释了抗癫痫的夏洛特网株背后的育种历史。这项新研究的不同之处在于其完整性。它包含了迄今最多的基因组,并且是第一个包含性染色体的研究,也因此是第一个具有单倍型解析分辨率的研究。

大麻是一种二倍体植物。这意味着,和人类一样,它包含两套染色体,一套遗传自雄性植株,另一套遗传自雌性植株。虽然迄今为止公布的大多数基因组只能解码一条染色体(也称为单倍型解析),但该团队解析了大麻的两套染色体。通过观察两套染色体,研究人员揭示出前所未有的遗传变异量——可能高达人类的20倍。

 

“有了这种单倍型解析,”帕吉特-科布解释说,“我们可以观察仅从其中一个亲本植物遗传下来的部分,并开始了解该植物的育种背景。”

该团队的研究收集了来自世界各地144株不同大麻植株的基因组,总共组装了193个基因组——其中181个是首次编目。基因组总数大于植株总数正是由于单倍型解析,因为每株被研究了两套染色体的植株产生了两个基因组组装结果。综合而言,这众多基因组构成了泛基因组,对其进行分析旨在理解大麻物种内遗传多样性的全部范围。

所收集基因组的高质量使研究人员能够解析以前未见过的遗传模式,包括负责大麻素合成的基因结构,并且通过纳入性染色体,首次对大麻Y染色体进行了观察。

他们的第一个发现是该物种内部存在意想不到的多样性。在整个泛基因组中,23%的基因存在于每个基因组中,55%的基因近乎普遍存在(见于95%-99%的基因组中),21%的基因存在于5%至94%的基因组中,不到1%的基因完全独特。一些最普遍的基因是那些产生大麻素的基因。

虽然大麻素基因在基因组间是一致的,但与脂肪酸代谢、生长和防御相关的基因则不然。这些可变基因是一个未开发的育种资源库,对它们进行选择性育种也可以使大麻在田间更具抗逆性,或者提高汉麻油的营养成分,使其在现有籽油中具有竞争力。值得注意的是,研究团队发现脂肪酸生物合成途径中的结构变异有助于产生四氢大麻萜酚(THCV),这是一种罕见的varin型大麻素,因其非精神活性的提神效果而受到关注。

通过更仔细地观察泛基因组中的大麻素基因,研究人员得出结论,THCAS和CBDAS这两个基因很可能因人类针对THC和CBD含量的定向育种而承受着强大的选择压力。重要的是,他们发现大麻素基因位于转座元件中。选择性地培育这些“跳跃”的转座元件内部的基因,反过来又在大麻植株间创造了巨大的多样性。

展望未来:为健康与产业优化植物

研究人员还确定了农业优化的一些有趣目标。首先,通过比较欧洲和亚洲基因组的差异,他们推断在亚洲某处可能存在着一个等待被发现的大麻古老近亲。这个野生近缘种将拥有与其独特环境历史相关的新颖遗传适应性,使其成为培育更具抗逆性大麻作物的宝贵信息源。

最后,对性染色体的新见解揭示,在“父本”植物中存在着特有的基因,这些基因可用于培育性能更优的后代。现代大麻育种利用了“雌性化”技术,即农民诱导雌株产生雄花——完全绕过了Y染色体。这些新发现表明,育种计划可能错过了那些被绕过的雄性基因组中编码的宝贵遗传多样性和性状潜力。将真正的雄性植株纳入育种策略,可以释放被忽视的遗传增益,并扩大作物改良的机会。

“在过去的10年里,育种者已经在提高产量和使大麻成为经济可行的作物方面做得相当不错,”共同第一作者、迈克尔实验室的博士后研究员瑞安·林奇说。“一旦市场对此产生兴趣,再加上这些可以指导育种工作的、对大麻基因组的新见解,我相信汉麻和汉麻油在人类健康和工业应用领域都将真正蓬勃发展。”

短期内,该团队希望这个泛基因组将成为全球研究人员的动态资源库,供其在此基础上构建并用于指导种植策略,帮助实现大麻作为纤维、籽油和药物种植的宝贵多用途作物的未开发潜力。