科学家们分析了近200个大麻基因组,创建了迄今最全面、高质量、详尽的植物基因图谱。该图谱揭示了大麻物种内部前所未有的多样性和复杂性,为基于大麻的农业、医药和工业发展奠定基础,并展现了人类与大麻长达万年的共生关系,证明大麻可成为与玉米、小麦同等重要的农作物。
索尔克研究所的研究人员创建了迄今最全面、高质量且精细的大麻遗传图谱。该团队分析了193个不同的大麻基因组(完整的遗传信息集),揭示了这一基础农业物种前所未有的多样性、复杂性及未开发的潜力。这一里程碑式的成就是与俄勒冈CBD公司、俄勒冈州立大学以及哈德逊阿尔法生物技术研究所多年合作的成果。
这项研究结果于2025年5月28日发表在《自然》期刊上,为大麻农业、医药及工业领域的变革性进展奠定了基础。
"大麻是地球上最非凡的植物之一。尽管在过去至少一万年中,它作为药物、食物、籽油和纤维的全球性资源具有重要地位,但仍是现代最欠开发的主要作物之一,这在很大程度上归因于长达一个世纪的法律限制,"该研究的资深作者、索尔克研究所研究教授托德·迈克尔表示。"我们团队通过分析近200个不同的大麻基因组,构建了迄今最完整的植物遗传图谱(即泛基因组),这表明我们才刚刚开始认识到这种神奇植物的全部潜力。同样的法律限制催生了地下育种革命,揭示了大麻作为化学工厂的强大能力。利用这份新的基因组蓝图,我们现在能应用现代育种技术,在农业、医药和生物技术领域解锁新的化合物和性状。"
背景介绍:作为化学工厂的大麻
大麻(Cannabis sativa),又称工业大麻,是原产于亚洲的开花植物。大麻因具备诸多独特特性而在人类历史上成为重要作物,例如它能生产用于纺织品的强韧纤维,或是因其作为少数能大量合成大麻素的植物之一而具有药用价值。当今创新者提出,通过适当育种,大麻油可与菜籽油或大豆油竞争;大麻衍生物甚至可能作为航空燃料的可持续替代品。
大麻是强大的化学工厂。其干重超过30%可转化为萜烯和大麻素——这些植物为抵御天敌产生的微量化学物质,却被人类用于调节情绪。萜烯造就了吸引我们接近水果和花朵的精致芳香,而大麻素通过与人体相互作用提供多种治疗特性。当"夏洛特的网"品种被用于治疗癫痫发作时,非精神活性的大麻二酚(CBD)改变了公众对大麻的认知。CBD、四氢大麻酚(THC)以及100多种尚未充分研究的大麻素已被用于治疗多种疾病,包括疼痛、关节炎、恶心、哮喘、抑郁和焦虑。
关键在于,这种选择性育种对大麻基因组多样性的影响始终是个谜团。由于大麻基因组结构复杂,破解此谜题极为困难。首先,大麻属于不足5%的雌雄异株植物。其次,大麻基因组包含大量转座元件(可在基因组内"跳跃"的重复DNA片段),因而难以追踪。
核心发现:新颖且惊人多样的遗传模式
科学家采用测序技术测定核酸模式(这些核酸在DNA双螺旋上连接形成碱基对)。传统短读长测序技术将DNA切割成片段逐一分析,每次仅处理数百碱基对。新型长读长测序技术则可一次性捕获数千碱基对。
"短读长测序技术存在发现局限,因为面对基因组的复杂区域(尤其是重复DNA序列)时,这些短基因片段无法有效拼接,"共同第一作者、迈克尔实验室博士后研究员莉莲·帕吉特-科布指出。"我们是首批在泛基因组层面大规模应用长读长技术的研究团队之一,由此获得了关于结构变异和基因排序的重要发现,这些发现可为育种优良性状的终极决策提供依据。"
该研究并非首次使用长读长测序——实际上,迈克尔本人早在2018年就率先通过长读长测序构建了大麻染色体水平基因组,揭示了合成大麻素的复杂遗传结构,并解释了抗癫痫品种"夏洛特的网"的育种史。本研究的突破性在于其完整性:包含迄今最多基因组数量,首次纳入性染色体,并因此首次实现单倍型解析。
大麻是二倍体植物。与人类相似,它包含两组染色体(一组遗传自父本,另一组来自母本)。虽然迄今公布的大多数基因组仅能解码一条染色体(即单倍型解析),但该团队成功解析了大麻的两组染色体。通过分析双套染色体,研究人员揭示了前所未有的遗传变异量——可能高达人类变异水平的20倍。
"凭借这种单倍型解析能力,"帕吉特-科布解释道,"我们可以追踪仅来自单一亲本的遗传物质,进而理解该植株的育种背景。"
该研究收集了全球144株不同大麻的基因组,最终组装出193个基因组(其中181个属首次编录)。基因组总数多于植株数的原因在于单倍型解析——每株被分析双套染色体的植株会产生两个基因组组装。这些基因组共同构成泛基因组,通过分析其整体揭示了大麻物种内的全部遗传多样性。
高质量基因组数据使研究人员能够解析前所未见的遗传模式,包括大麻素合成相关基因的结构,并通过整合性染色体首次观测大麻Y染色体。
首要发现是物种内部存在超预期的多样性:泛基因组中有23%的基因存在于所有基因组中,55%基因近乎普遍存在(出现于95%-99%基因组),21%基因分布于5%-94%基因组之间,不足1%的基因完全独特。部分最普遍的基因正是产生大麻素的基因。
虽然大麻素基因在基因组间高度保守,但脂肪酸代谢、生长和防御相关基因则不然。这些可变基因构成未开发的育种资源库,其选择性育种既能增强大麻的田间抗逆性,亦可提升大麻籽油的营养成分,使其在现有植物油中具备竞争力。值得注意的是,研究团队发现脂肪酸生物合成通路的结构变异导致四氢大麻酚丁酸酯(THCV)的生成——这种稀有的丁酸型大麻素因其非精神活性的提神功效而受关注。
深入研究泛基因组中的大麻素基因后,研究人员得出结论:THCAS和CBDAS这两个基因可能因人类针对THC和CBD含量的定向育种而承受强烈选择压力。关键的是,他们发现大麻素基因位于转座元件内。对这些"跳跃"转座元件内部基因的选择性育种,反过来造就了大麻植株间的巨大多样性。
未来展望:优化植物健康与产业应用
研究人员还确定了农业优化的关键目标。首先,通过对比欧洲与亚洲基因组差异,他们推断亚洲某处可能存在待发现的远古大麻近缘种。这个野生近缘种因其独特环境历史形成的遗传适应性,将成为培育更具抗逆性大麻作物的宝贵资源。
最后,针对性染色体的新发现揭示了仅存于"父本"植株中的特殊基因,可用于培育性能更优的后代。现代大麻育种采用"雌化"技术(诱导雌株产生雄花),完全避开了Y染色体。这些新发现表明,育种计划可能遗漏了被忽略的雄株基因组所编码的宝贵遗传多样性和性状潜力。将真实雄株纳入育种策略,可释放被忽视的遗传增益并拓展作物改良机遇。
"过去十年间,育种者已在提高产量和实现大麻经济可行性方面取得显著进展,"共同第一作者、迈克尔实验室博士后研究员瑞安·林奇表示。"随着市场需求的增长,结合这些能指导育种工作的大麻基因组新发现,我认为工业大麻及其油脂将在人类健康和工业应用领域迎来真正繁荣。"
短期内,研究团队希望该泛基因组成为全球研究人员的动态资源库,用以制定种植策略,助力实现大麻作为纤维、籽油和药物多用途作物的未开发潜力。