通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 地球与气候

运行AI思维模型时碳排放量激增50倍,结果却常徒劳无功

本站发布时间:2025-08-03 13:29:20
注:部分名称可能翻译不全,如有问题可联系15163559288@163.com

这种转换以及其他计算过程都会产生 CO2 排放。然而,许多用户并未意识到这些技术背后巨大的碳足迹。如今,德国的研究人员通过一套标准化问题测量并比较了不同的、已训练好的大型语言模型(LLM)的 CO2 排放量。

“询问已训练 LLM 对环境的影响很大程度上取决于其推理方式,显性推理过程会显著推高能耗和碳排放,”该研究的第一作者、慕尼黑应用科学大学研究员 Maximilian Dauner 表示,他是《Frontiers in Communication》期刊上该研究的第一作者。“我们发现,启用推理功能的模型产生的 CO2 排放量是简洁响应模型的 50 倍之多。”

“思考”的 AI 造成最多排放

研究人员在涵盖不同学科的 1000 个基准问题上评估了 14 个参数量从 70 亿到 720 亿不等的 LLM。参数量决定了 LLM 学习和处理信息的方式。

推理模型平均为每个问题生成 543.5 个“思考”令牌(token),而简洁模型每个问题仅需 37.7 个令牌。思考令牌是推理型 LLM 在生成答案前产生的额外令牌。令牌占用越高总是意味着 CO2 排放越高。然而,这并不必然意味着产生的答案更正确,因为详尽的细节并非总是正确性所必需的。

最准确的模型是启用了推理功能、拥有 700 亿参数的 Cogito 模型,准确率达到 84.9%。该模型产生的 CO2 排放量是生成简洁答案的同等规模模型的三倍。“目前,我们看到 LLM 技术中存在着明显的准确性与可持续性之间的权衡,” Dauner 说。“在回答这 1000 个问题时,所有保持排放低于 500 克二氧化碳当量的模型中,没有一个能达到超过 80% 的准确率。”二氧化碳当量(CO2 equivalent)是用于衡量各种温室气体气候影响的单位。

 

主题内容也导致了显著不同的 CO2 排放水平。例如,需要冗长推理过程的问题,如抽象代数或哲学,其导致的排放量比更直接的主题(如高中历史)高出六倍之多。

践行深思熟虑的使用

研究人员表示,希望他们的工作能促使人们对自己的 AI 使用做出更明智的决定。“用户可以通过提示 AI 生成简洁答案,或将高容量模型的使用限制在真正需要其能力的任务上,从而显著减少排放,” Dauner 指出。

例如,模型的选择会对 CO2 排放产生重大影响。举例来说,让 DeepSeek R1(700 亿参数)回答 60 万个问题所产生的 CO2 排放量,相当于一次从伦敦到纽约的往返航班。与此同时,通义千问 2.5(Qwen 2.5,720 亿参数)在产生相同排放量的情况下,能以相近的准确率回答三倍多的问题(约 190 万个)。

研究人员表示,他们的结果可能受到研究中使用的硬件选择、一个可能因地区电网结构不同而异的排放系数以及所考察模型的影响。这些因素可能限制了结果的普适性。

“如果用户知道其 AI 生成内容(例如随意将自己变成一个动作玩偶)的确切二氧化碳成本,他们可能会更谨慎、更有选择性地决定何时以及如何使用这些技术,” Dauner 总结道。

Story Source:

Materialsprovided byFrontiers.Note: Content may be edited for style and length.

Journal Reference:

Maximilian Dauner, Gudrun Socher.Energy costs of communicating with AI.Frontiers in Communication, 2025; 10 DOI:10.3389/fcomm.2025.1572947

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

北前院微信公众号