科学家分析了近200个大麻基因组,创建了迄今最全面、高质量、精细的植物基因图谱。该图谱揭示了大麻物种内部前所未有的多样性与复杂性,为基于大麻的农业、医药和工业进步奠定基础,并延续了人类与大麻长达一万年的共生关系,证明大麻可成为与玉米或小麦同等重要的作物。
索尔克研究所(Salk Institute)的研究人员创建了迄今为止最全面、高质量且详细的大麻遗传图谱。该团队分析了193个不同的大麻基因组(完整的遗传信息集),揭示了这一基础农业物种内部前所未有的多样性、复杂性和未开发的潜力。这一里程碑式的成就是与俄勒冈CBD公司、俄勒冈州立大学和哈德逊阿尔法生物技术研究所多年合作的成果。
这些发现于2025年5月28日发表在《自然》(Nature)杂志上,为基于大麻的农业、医学和工业领域的变革性进步奠定了基础。
“大麻是地球上最非凡的植物之一。尽管在至少过去10,000年里,它作为药物、食物、籽油和纤维的来源具有全球重要性,但在现代它仍然是最欠开发的主要农作物之一,这在很大程度上是由于长达一个世纪的法律限制,”该研究的资深作者、索尔克研究所研究教授托德·迈克尔(Todd Michael)说。“我们的团队通过分析近200个不同的大麻基因组,构建了迄今为止该植物最完整的遗传图谱,即泛基因组(pangenome),这表明我们才刚刚开始看到这种神奇植物的全部潜力。同样的法律限制刺激了一场地下育种革命,揭示了大麻作为化学工厂的强大能力。有了这个新的基因组蓝图,我们现在可以应用现代育种技术,在农业、医学和生物技术领域解锁新的化合物和性状。”
背景:大麻作为化学动力工厂
大麻(Cannabis sativa),也称为汉麻(hemp),是一种原产于亚洲的开花植物。大麻有许多独特特性,使其在人类历史进程中成为一种重要作物,例如它能生产用于纺织品的坚韧纤维,或者其药用特性源于它是少数能大量生产大麻素的植物之一。当今的创新者提出,通过适当的育种,大麻油可能媲美菜籽油或大豆油,甚至大麻衍生物可用作喷气燃料的可持续替代品。
大麻是一个化学动力工厂。其干重的30%以上可产出萜烯和大麻素,这些是植物制造的用于抵御捕食者的小分子化学物质,但人类将其用于改变情绪的目的。萜烯产生吸引我们喜欢水果和花朵的精妙香气,而大麻素则与人体相互作用,提供许多治疗特性。一种名为非精神活性大麻二酚(CBD)的大麻素,当"夏洛特网"(Charlotte's Web)品系被用于治疗癫痫发作时,改变了公众对大麻的看法。CBD、四氢大麻酚(THC)以及100多种研究尚不充分的大麻素已被用于治疗多种疾病,包括疼痛、关节炎、恶心、哮喘、抑郁和焦虑。
重要的是,这种选择性育种对大麻基因组多样性的影响一直是个谜。解开这个谜团已被证明很困难,因为大麻的基因组很复杂。首先,大麻属于不到5%的具有雌雄异株(即雌性和雄性植株分离)特性的植物。其次,大麻基因组包含许多转座元件(transposable elements),这些是能围绕基因组"跳跃"的重复DNA片段,因此难以追踪。
关键发现:新颖且惊人多样化的遗传模式
科学家使用一种称为测序(sequencing)的技术来确定核酸的模式,这些核酸跨越DNA的双螺旋结构形成碱基对(base pairs)。传统的短读长(short-read)测序方法将DNA切碎以逐段研究,一次仅几百个碱基对。更新的长读长(long-read)测序技术可以一次捕获数千个碱基对。
“短读长测序技术在可发现的内容上存在局限,因为当观察基因组的复杂区域,特别是重复DNA序列时,那些短的遗传片段不可能以任何有意义的方式拼接起来,”共同第一作者、迈克尔实验室的博士后研究员莉莲·帕吉特-科布(Lillian Padgitt-Cobb)说。“我们是首批在泛基因组背景下大规模利用这种长读长技术的团队之一,由此获得的关于结构变异(structural variation)和基因排序(gene ordering)等各方面的见解,可以为最终将优良性状育种到大麻植物中的决策提供依据。”
该研究并非首次使用长读长测序——事实上,迈克尔本人在2018年就曾率先使用长读长测序生成了大麻的染色体水平基因组,揭示了合成大麻素的复杂遗传结构,并解释了抗癫痫品系"夏洛特网"背后的育种历史。这项新研究的独特之处在于其完整性。它包含了迄今为止最多的基因组,并且是首个包含性染色体的研究,也因此是首个具有单倍型分辨率(haplotype resolution)的研究。
大麻是一种二倍体(diploid)植物。这意味着,像人类一样,它包含两套染色体,一套遗传自雄性植株,另一套遗传自雌性植株。尽管迄今为止公布的大多数基因组只能解码一条染色体(也称为单倍型分辨率),但该团队解析了大麻的两套染色体。通过观察两套染色体,研究人员揭示了前所未有的遗传变异量——可能高达人类的20倍。
“有了这种单倍型分辨率,”帕吉特-科布解释道,“我们可以观察仅从其中一个亲本植物遗传下来的内容,并开始了解该植物的育种背景。”
该团队的研究收集了来自世界各地144株不同大麻植物的基因组,总共组装了193个基因组——其中181个是此前从未编目的。基因组总数多于植株总数是由于单倍型分辨率,因为每株被研究了两套染色体的植物产生了两个基因组组装。这些众多的基因组共同构成了泛基因组,通过分析泛基因组,可以了解大麻物种内遗传多样性的全部范围。
所收集基因组的高质量使研究人员能够解析以前未见过的遗传模式,包括负责大麻素合成的基因结构,并且通过纳入性染色体,首次观察了大麻的Y染色体。
他们的第一个发现是,该物种内部存在出乎意料的多样性。在整个泛基因组中,23%的基因存在于每一个基因组中,55%的基因近乎普遍存在(在95%-99%的基因组中可见),21%的基因存在于5%至94%的基因组中,少于1%的基因完全独特。一些最普遍的基因是那些产生大麻素的基因。
虽然大麻素基因在基因组间是一致的,但与脂肪酸代谢、生长和防御相关的基因则不一致。这些可变基因是一个未开发的育种库,对它们进行选择性育种也可以使大麻在田间更具抗逆性,或提高汉麻油的营养价值,使其在现有籽油中具有竞争力。值得注意的是,研究团队发现脂肪酸生物合成途径中的结构变异促进了四氢大麻萜酚(THCV)的产生,这是一种稀有的萜酚型大麻素,因其非精神活性的提神效果而受到关注。
通过更仔细地观察泛基因组中的大麻素基因,研究人员得出结论,THCAS和CBDAS这两个基因很可能因人类针对THC和CBD含量的定向育种而承受着强烈的选择压力。重要的是,他们发现大麻素基因位于转座元件内。反过来,对这些"跳跃"的转座元件内部的基因进行选择性育种,在大麻植物间创造了巨大的多样性。
展望未来:为健康与工业优化植物
研究人员还确定了农业优化的重要目标。首先,通过观察欧洲和亚洲基因组的差异,他们得出结论,在亚洲某个地方可能存在一个等待被发现的古老大麻近缘种。这个野生近缘种将拥有与其独特环境历史相关的新颖遗传适应性,从而成为培育更具抗逆性作物的大麻植物的宝贵信息资源。
最后,对性染色体的新见解揭示,存在仅存在于"父本"植物中的基因,可用于培育性能更优的后代。现代大麻育种利用"雌株化(feminization)"技术,即农民诱导雌性植株产生雄性花朵——完全绕过了Y染色体。这些新发现表明,育种项目可能错过了那些被绕过的雄性基因组中编码的有价值的遗传多样性和性状潜力。将真正的雄性植株纳入育种策略,可能释放被忽视的遗传增益,并扩大作物改良的机会。
“在过去的10年里,育种者已经在提高产量和使大麻成为经济可行的作物方面做得相当不错,”共同第一作者、迈克尔实验室的博士后研究员瑞安·林奇(Ryan Lynch)说。“一旦市场对此产生兴趣,再结合这些能指导育种工作的大麻基因组新见解,我认为汉麻和汉麻油在人类健康和工业应用领域都将真正蓬勃发展。”
短期内,该团队希望泛基因组将作为一个动态资源,供世界各地的研究人员在此基础上进行构建,并用于指导种植策略,帮助实现大麻作为一种用于纤维、籽油和药物的宝贵多用途作物的未开发潜力。