通过跨学科的合作与交流,我们能够突破传统思维的边界,开拓新的研究领域。

——院长致词

首页 > 科学研究 > 信息科技

思考型人工智能模型的二氧化碳排放量高出50倍——而且往往徒劳无功(注:严格遵循技术细节,"50x"译为"50倍","CO2"保留专业术语&q

本站发布时间:2025-08-22 12:39:18
注:部分名称可能翻译不全,如有问题可联系15163559288@163.com

这种转换以及其他计算过程会产生二氧化碳(CO2)排放。然而,许多用户并未意识到这些技术背后巨大的碳足迹。如今,德国的研究人员使用一套标准化问题,测量并比较了不同已训练大型语言模型(LLM)的CO2排放量。

"询问已训练LLMs对环境的影响很大程度上取决于其推理方式,显式的推理过程会显著推高能耗和碳排放,"该研究的第一作者、慕尼黑应用科学大学研究员Maximilian Dauner表示,他是发表在《Frontiers in Communication》期刊上这项研究的主要作者。"我们发现,启用推理功能的模型产生的CO2排放量比简洁响应模型高出50倍。"

"思考型"人工智能碳排放量最高

研究人员在涵盖多个学科的1,000个基准问题上评估了14个LLM,其参数量从70亿到720亿不等。参数量决定了LLMs学习和处理信息的方式。

推理模型平均每个问题生成543.5个"思考"token,而简洁模型每个问题仅需37.7个token。思考token是推理型LLM在生成答案前产生的额外token。更高的token足迹总是意味着更高的CO2排放量。然而,这并不必然意味着最终答案更正确,因为详尽的细节并非总是正确性所必需的。

最准确的模型是启用推理功能、拥有700亿参数的Cogito模型,准确率达到84.9%。该模型产生的CO2排放量是生成简洁答案的同规模模型的三倍。"目前,我们看到LLM技术中固有的准确性与可持续性之间的权衡关系,"Dauner说。"在排放量低于500克二氧化碳当量的模型中,没有一个能在正确回答1,000个问题上达到80%以上的准确率。"二氧化碳当量(CO2 equivalent)是用于衡量各种温室气体气候影响的单位。

 

主题内容也导致CO2排放水平存在显著差异。例如,需要冗长推理过程的问题(如抽象代数或哲学)导致的排放量比更直接的主题(如高中历史)高出六倍。

践行审慎使用

研究人员表示,希望他们的工作能促使人们对自身AI使用做出更明智的决定。"用户可以通过提示AI生成简洁答案,或将高容量模型的使用限制在真正需要其能力的任务上,从而显著减少排放,"Dauner指出。

模型选择对CO2排放量有显著影响。例如,让DeepSeek R1(700亿参数)回答60万个问题所产生的CO2排放量,相当于从伦敦到纽约的往返航班。与此同时,在产生相同排放量的情况下,Qwen 2.5(720亿参数)能以相似的准确率回答三倍多的问题(约190万个)。

研究人员表示,他们的结果可能受到研究所用硬件选择的影响。硬件产生的排放因子可能因地区能源结构组成而异,并且受检模型的选择也会影响结果。这些因素可能限制研究结果的普适性。

"如果用户了解其AI生成输出的确切二氧化碳成本——比如随意将自己变成动作人物——他们可能会在使用这些技术的时机和方式上更具选择性和深思熟虑,"Dauner总结道。

Story Source:

Materialsprovided byFrontiers.Note: Content may be edited for style and length.

Journal Reference:

Maximilian Dauner, Gudrun Socher.Energy costs of communicating with AI.Frontiers in Communication, 2025; 10 DOI:10.3389/fcomm.2025.1572947

排行榜

备案号:京ICP备2023036195号-1

地址:北京市丰台区南三环西路16号2号楼

地址:山东省济南市历城区唐冶绿地汇中心36号楼

电话: 400-635-0567

北前院微信公众号