大麻属泛基因组揭示药用与工业应用潜力

科学家分析了近200株大麻基因组,创建了迄今最全面、高质量、精细的大麻遗传图谱。该图谱揭示了该物种前所未有的多样性与复杂性,为基于大麻的农业、医疗和工业发展奠基基础,并延续了人类与大麻长达一万年的共生关系,证明大麻可成为与玉米、小麦同等重要的农作物。

索尔克研究所的研究人员创建了迄今为止最全面、高质量、详细的大麻遗传图谱。该团队分析了193个不同的大麻基因组(整套遗传信息),揭示了这种基础农业物种前所未有的多样性、复杂性和未开发的潜力。这一里程碑式的成就是与俄勒冈CBD公司、俄勒冈州立大学和哈德逊阿尔法生物技术研究所多年合作的成果。

这些发现于2025年5月28日发表在《自然》杂志上,为基于大麻的农业、医药和工业的变革性进步奠定了基础。

“大麻是地球上最非凡的植物之一。尽管在至少过去10,000年里,它作为药物、食物、种子油和纤维的来源具有全球重要性,但它仍然是当今最欠开发的主要农作物之一,这在很大程度上是由于长达一个世纪的法律限制,”该研究的资深作者、索尔克研究所研究教授托德·迈克尔说。“我们的团队通过分析近200个不同的大麻基因组,构建了迄今为止最完整的植物遗传图谱,即泛基因组,这表明我们才刚刚开始窥见这种神奇植物的全部潜力。同样的法律限制催生了一场地下育种革命,揭示了大麻作为化学工厂的强大能力。有了这个新的基因组蓝图,我们现在可以应用现代育种技术,在农业、医药和生物技术领域解锁新的化合物和性状。”

背景:大麻作为化学动力工厂

Cannabis sativa,又称大麻,原产于亚洲,是一种开花植物。大麻具有许多独特特性,使其在人类历史进程中成为重要作物,例如其能生产用于纺织品的强韧纤维,或其药用品质源于它是少数能大量产生大麻素的植物之一。当今的创新者提出,通过适当的育种,大麻油有望媲美菜籽油或大豆油,或者大麻衍生物甚至可能用作航空燃料的可持续替代品。

大麻是一个化学动力工厂。其干重的30%以上可产生萜烯和大麻素,这些小分子化学物质是植物为抵御捕食者而产生的,但人类却利用它们来改变情绪。萜烯产生吸引我们喜爱水果和花朵的精致香气,而大麻素则通过与人体相互作用提供多种治疗特性。一种非致幻性的大麻素——大麻二酚(CBD),在“夏洛特的网”品种被用于治疗癫痫发作时,改变了公众对大麻的看法。CBD、四氢大麻酚(THC)以及100多种鲜为人知的大麻素已被用于治疗多种疾病,包括疼痛、关节炎、恶心、哮喘、抑郁和焦虑。

 

重要的是,这种选择性育种对大麻基因组多样性的影响一直是个谜。解开这个谜团被证明是困难的,因为大麻拥有复杂的基因组。首先,大麻属于不到5%的雌雄异株植物(即雌性和雄性个体分别在不同的植株上)。其次,大麻基因组包含许多转座元件,这些是能够在基因组中“跳跃”的重复DNA片段,因此难以追踪。

关键发现:新颖且令人惊讶的多样化遗传模式

科学家使用一种称为测序的技术来确定核酸的模式,这些核酸连接在DNA的双螺旋结构上形成碱基对,沿着DNA链排列。传统的短读长测序方法将DNA打碎成片段逐个研究,一次只能处理几百个碱基对。更新的长读长测序技术可以一次性捕获数千个碱基对。

“短读长测序技术在发现能力上存在局限,因为当观察基因组的复杂区域,尤其是重复DNA序列时,那些短小的遗传片段无法以任何有意义的方式拼接起来,”共同第一作者、迈克尔实验室博士后研究员莉莲·帕吉特-科布说。“我们是首批在泛基因组背景下大规模应用这种长读长技术的研究人员之一,随之而来的是对结构变异和基因排序的所有这些洞察,这些信息可以为最终将有利性状培育到大麻植物中的决策提供依据。”

这项研究并非首次使用长读长测序——事实上,迈克尔本人早在2018年就首次使用长读长测序生成了大麻的染色体水平基因组,揭示了合成大麻素的复杂遗传结构,并解释了抗癫痫品种夏洛特的网背后的育种历史。这项新研究的独特之处在于其完整性。它包含了迄今为止最多的基因组,并且是第一个包含性染色体的研究,因此也是第一个具有单倍型解析能力的研究。

大麻是一种二倍体植物。这意味着,和人类一样,它包含两套染色体,一套继承自父本植株,另一套继承自母本植株。虽然迄今为止公布的大多数基因组只能解码一条染色体(也称为单倍型解析),但该团队解析了大麻套染色体。通过查看两套染色体,研究人员揭示了前所未有的遗传变异量——可能高达人类的20倍。

 

“凭借这种单倍型解析能力,”帕吉特-科布解释道,“我们可以查看仅从其中一个亲本植株继承的遗传物质,并开始了解该植株的育种背景。”

该团队的研究收集了来自世界各地144株不同大麻植株的基因组,共组装了193个基因组——其中181个是首次编录。基因组总数多于植株总数是由于单倍型解析的缘故,因为每株被研究了两套染色体的植株都产生了两个基因组组装。这些众多的基因组共同构成了泛基因组,通过分析它来理解大麻物种内遗传多样性的全部范围。

所收集基因组的高质量使研究人员能够解析先前未见的遗传模式,包括负责大麻素合成的基因结构,以及通过纳入性染色体,首次观察到大麻的Y染色体。

他们的第一个发现是该物种内部存在意想不到的多样性。在整个泛基因组中,23%的基因存在于每个基因组中,55%的基因近乎普遍存在(在95%-99%的基因组中出现),21%的基因存在于5%到94%的基因组中,不到1%的基因完全独特。一些最普遍的基因是那些产生大麻素的基因。

虽然大麻素基因在基因组间是一致的,但与脂肪酸代谢、生长和防御相关的基因则不然。这些可变基因是一个尚未开发的育种池,对它们进行选择性育种也可以使大麻在田间更具抗逆性,或者提高大麻油的营养成分,使其在现有种子油中具备竞争力。值得注意的是,研究团队发现脂肪酸生物合成途径中的结构变异有助于产生四氢大麻酚(THCV),这是一种罕见的瓦林型大麻素,因其非精神活性的提神效果而受到关注。

通过更仔细地观察泛基因组中的大麻素基因,研究人员得出结论,两个基因——THCAS和CBDAS——很可能因人类为追求特定THC和CBD含量而进行的定向育种而承受着强大的选择压力。重要的是,他们发现大麻素基因位于转座元件内。对这些“跳跃的”转座元件内部的基因进行选择性育种,反过来又在大麻植株间创造了巨大的多样性。

展望未来:为健康和工业优化植物

研究人员还发现了农业优化的有趣目标。首先,通过比较欧洲和亚洲基因组的差异,他们得出结论,亚洲某处可能存在着一个等待被发现的大麻古老近缘种。这个野生近缘种将拥有与其独特环境历史相关的新颖遗传适应性,是培育更具抗逆性大麻作物的宝贵信息资源。

最后,对性染色体的新见解揭示了仅在“父本”植株中存在的基因,可用于培育表现更优的后代。现代大麻育种采用“雌性化”技术,即种植者诱导雌株产生雄花——完全绕过了Y染色体。这些新发现表明,育种计划可能错过了那些被绕过的雄性基因组中所编码的宝贵遗传多样性和性状潜力。将真正的雄株纳入育种策略,可以解锁被忽视的遗传增益,并扩大作物改良的机会。

“在过去10年里,育种者已经在提高产量和大麻使其成为经济上可行的作物方面做得相当不错,”共同第一作者、迈克尔实验室博士后研究员瑞安·林奇说。“一旦市场对此产生兴趣,再加上这些能够指导育种工作的、对大麻基因组的新见解,我相信大麻和大麻油在人类健康应用和工业应用方面都将真正蓬勃发展。”

短期内,该团队希望这个泛基因组将作为一项动态资源,供全世界研究人员在此基础上继续研究,并用于指导种植策略,帮助实现大麻作为用于纤维、种子油和药物的多用途作物的未开发潜力。