大麻属泛基因组揭示其潜在药用与工业价值

科学家们通过对近200份大麻基因组进行分析,创建了迄今最全面、高质量、详细的该植物基因图谱。该图谱揭示了该物种内部前所未有的多样性和复杂程度,为基于大麻的农业、医药及工业发展奠定基础,同时延续了人类与大麻长达一万年的共生关系——研究表明大麻的重要性堪比玉米或小麦等主要农作物。

索尔克研究所的研究人员创建了迄今为止最全面、高质量且详细的大麻基因图谱。该团队分析了193种不同的大麻基因组(完整的遗传信息集),揭示了这一基础农业物种前所未有的多样性、复杂性和未开发潜力。这一里程碑式的成就是与俄勒冈CBD公司、俄勒冈州立大学以及哈德逊阿尔法生物技术研究所多年合作的成果。

这项于2025年5月28日发表在Nature杂志上的研究结果为基于大麻的农业、医药和工业领域的变革性进步奠定了基础。

"大麻是地球上最非凡的植物之一。尽管在过去至少一万年里,它作为药物、食物、种子油和纤维的全球重要性无可争议,但它仍是现代最不发达的主要作物之一,这在很大程度上源于长达一个世纪的法律限制,"该研究的资深作者、索尔克研究所研究教授托德·迈克尔表示。"我们团队通过分析近200个不同的大麻基因组,构建了迄今为止最完整的植物遗传图谱——泛基因组,这表明我们才刚刚开始认识到这种神奇植物的全部潜力。同样的法律限制催生了地下育种革命,揭示了大麻作为'化学工厂'的巨大潜力。借助这份新的基因组蓝图,我们现在可以应用现代育种技术,在农业、医药和生物技术领域解锁新型化合物和性状。"

背景:作为化学动力工厂的大麻

Cannabis sativa(又名工业大麻)是一种原产于亚洲的开花植物。大麻具有许多独特特性,使其在人类历史上成为重要作物,例如能生产用于纺织品的强韧纤维,或因其作为少数能大量合成大麻素的植物之一而具有的药用价值。当今创新者提出,通过适当育种,大麻油可与菜籽油或大豆油竞争,甚至大麻衍生物可作为喷气燃料的可持续替代品。

大麻是化学动力工厂。其干重的30%以上可转化为萜烯和大麻素——这些植物为抵御捕食者产生的微量化学物质,却被人类用于调节情绪。萜烯产生吸引我们接近水果和花朵的精致香气,而大麻素则通过与人体相互作用提供多种治疗特性。当"夏洛特网"品系被用于治疗癫痫发作时,非致幻性大麻二酚(CBD)改变了大麻在公众心目中的认知。CBD、四氢大麻酚(THC)以及100多种尚未被充分研究的其他大麻素已被用于治疗多种疾病,包括疼痛、关节炎、恶心、哮喘、抑郁和焦虑。

 

重要的是,这种选择性育种对大麻基因组多样性的影响始终是个谜团。由于大麻基因组结构复杂,破解此谜题异常困难。首先,大麻属于不足5%的雌雄异株植物(雌株和雄株分离)。其次,大麻基因组包含大量转座元件——这些可"跳跃"于基因组中的重复DNA片段极难追踪。

关键发现:新颖且高度多样化的遗传模式

科学家使用称为测序的技术来确定核酸的模式,这些核酸在DNA双螺旋上连接形成碱基对。传统的短读长测序方法将DNA片段化后进行逐段检测,一次仅能读取几百个碱基对。新型长读长测序技术则可一次性捕获数千个碱基对。

"短读长测序技术的发现能力存在局限,尤其在观察基因组的复杂区域(特别是重复DNA序列)时,短基因片段几乎无法以有意义的方式拼接,"共同第一作者、迈克尔实验室博士后研究员莉莲·帕吉特-科布解释道。"我们属于首批在泛基因组研究中大规模应用长读长技术的团队,由此获得了关于结构变异和基因排序的全新见解,这些发现可指导最终决策,将优良性状选育至大麻植株中。"

本研究并非首次使用长读长测序——事实上,迈克尔本人早在2018年就率先利用长读长测序生成了大麻染色体水平基因组,揭示了合成大麻素的复杂遗传结构,并阐释了抗癫痫品系"夏洛特网"的育种史。此项新研究的突破性在于其完整性:它包含迄今最多基因组,首次纳入性染色体,并因此首次实现单倍型解析。

大麻是二倍体植物。这意味着,与人类相似,它包含两组染色体,一组遗传自雄性植株,另一组遗传自雌性植株。尽管此前公布的基因组大多仅能解码一条染色体(即单倍型解析),但该团队成功解析了大麻的染色体组。通过研究双染色体组,研究人员揭示了前所未有的遗传变异量——可能高达人类的20倍。

 

"通过这种单倍型解析,"帕吉特-科布阐述道,"我们可以追踪仅来自单一亲本植株的遗传物质,进而理解该植株的选育背景。"

该研究收集了来自全球144株不同大麻植株的基因组,共组装出193个基因组——其中181个为首次编录。基因组总数多于植株总数归因于单倍型解析技术——每株被测序双染色体组的植物会产生两个基因组组装。这些基因组共同构成了泛基因组,研究人员通过分析泛基因组以理解大麻物种内遗传多样性的全貌。

高质量基因组数据使研究人员能够解析前所未见的遗传模式,包括大麻素合成相关基因的结构,并通过整合性染色体首次观察到Y染色体。

他们的首要发现是该物种存在惊人的多样性。在泛基因组中,23%的基因存在于所有基因组中,55%的基因近乎普遍存在(出现于95%-99%的基因组),21%的基因分布于5%-94%的基因组中,少于1%的基因完全独特。部分最普遍的基因正是产生大麻素的基因。

尽管大麻素基因在基因组间高度保守,但脂肪酸代谢、生长和防御相关基因则不然。这些可变基因是尚未开发的育种资源池,对其进行选择性育种既能增强大麻的田间抗逆性,也能提升大麻油的营养价值,使其在现有植物油中具备竞争力。值得注意的是,研究团队发现脂肪酸生物合成通路中的结构变异促进了四氢大麻瓦林(THCV)的产生——这是一种稀有的瓦林型大麻素,因其非精神活性、提神功效而备受关注。

通过深入研究泛基因组中的大麻素基因,研究人员推断THCAS和CBDAS两个基因可能因人为选育追求THC和CBD含量而承受强选择压力。关键的是,他们发现大麻素基因位于转座元件内。对这些"跳跃"转座元件内部基因的选择性育种,反过来创造了大麻植株间的巨大多样性。

未来展望:为健康与产业优化植物

研究人员还确定了农业优化的重要目标。首先,通过比对欧洲和亚洲基因组差异,他们推断亚洲某处可能存在待发现的古老大麻近缘种。这种野生近缘种将携带与其独特环境史相关的新颖遗传适应性特质,为选育更具抗逆性的大麻作物提供宝贵信息。

最后,关于性染色体的新发现揭示了仅存在于"父本"植株中的特定基因,可用于培育性能更优的后代。现代大麻育种采用"雌化"技术——种植者诱导雌株产生雄花,从而完全绕过Y染色体。这些新发现表明,育种计划可能遗漏了那些被忽视的雄性基因组中蕴含的宝贵遗传多样性和性状潜力。将纯合雄性植株纳入育种策略,可释放被低估的遗传效益,拓展作物改良空间。

"过去十年间,育种者已在提高产量和实现大麻经济可行性方面取得显著进展,"共同第一作者、迈克尔实验室博士后研究员瑞安·林奇表示。"一旦市场兴趣被激发,再结合这些能指导育种实践的大麻基因组新发现,我认为大麻和大麻油将在人类健康和工业应用领域迎来真正的繁荣。"

短期内,该团队希望泛基因组能成为全球研究人员的动态资源库,为种植策略提供依据,助力实现大麻作为纤维、种子油和药物来源的多用途作物的未开发潜力。