此类转换以及其他计算过程均会产生CO2排放。然而许多用户并未意识到这些技术伴随的显著碳足迹。目前,德国研究人员通过一组标准化问题,测量并比较了不同已训练大型语言模型(LLM)的CO2排放量。
"训练后LLM问答对环境的影响很大程度上取决于其推理机制,显式推理过程会显著推高能耗与碳排放,"该研究的第一作者、慕尼黑应用科技大学研究员马克西米利安·道尔在《传播前沿》期刊论文中指出。"我们发现启用推理功能的模型产生的CO2排放量最高可达简洁应答模型的50倍。"
'思考型'人工智能产生最多排放
研究人员针对1,000个涵盖多学科的基准问题,评估了14个参数规模从70亿到720亿不等的LLM。参数决定了LLM学习与处理信息的方式。
推理模型平均每个问题产生543.5个"思考"标记,而简洁模型仅需37.7个标记。思考标记是推理型LLM在生成答案前产生的额外标记。更高的标记占用率始终意味着更高的CO2排放。但这并不必然导致答案正确率提升,因为详尽的细节并非总是准确性的必要条件。
准确率最高的模型是具备推理功能的700亿参数Cogito模型,达到84.9%准确率。该模型的CO2排放量是同规模简洁应答模型的三倍。"当前我们看到LLM技术存在明显的准确性与可持续性权衡,"道尔表示。"在保持排放低于500克二氧化碳当量的模型中,没有任何模型能在1,000个问题的正确回答率上超过80%。"二氧化碳当量是用于衡量各类温室气体气候影响的单位。
问题主题也导致CO2排放水平显著差异。需要长推理过程的问题(如抽象代数或哲学),其排放量比高中历史等直接主题高出六倍。
践行审慎使用原则
研究人员希望其工作能促使人们更明智地决策AI使用方式。"用户可通过要求AI生成简洁答案,或将高容量模型限制在真正需要其能力的任务中,显著降低排放,"道尔强调。
模型选择对CO2排放影响显著。例如:使用DeepSeek R1(700亿参数)回答60万个问题产生的CO2排放量,相当于伦敦至纽约的往返航班;而Qwen 2.5(720亿参数)在同等排放量下,能以相近准确率回答超过三倍数量的问题(约190万个)。
研究人员指出,研究结果可能受硬件选择、存在地域差异的电网排放因子及所检模型的影响,这些因素可能限制结果的普适性。
"如果用户知晓AI生成内容的确切CO2成本——例如随意将自拍照转成手办形象——他们可能会更审慎地选择使用这些技术的时机与方式,"道尔总结道。
Story Source:
Materialsprovided byFrontiers.Note: Content may be edited for style and length.
Journal Reference:
Maximilian Dauner, Gudrun Socher.Energy costs of communicating with AI.Frontiers in Communication, 2025; 10 DOI:10.3389/fcomm.2025.1572947
2025-08-02
2025-08-02
2025-08-02
2025-08-02