研究结果:在基础数学作业上,ChatGPT获得A级评分,但部分答案存在怪异之处。然而在需要推理能力的高阶问题上,其得分仅为D级。
博士生戈库尔·普图马拉尼兰表示:"我们发现ChatGPT技术能在结构化基础题上取得A级评分。但在开放性问题上仅获62分,导致其学期总评降至82分(B级下位)。人类学生的班级平均分为84.85%,因为他们能处理需要高阶推理的问题。"
研究结论指出:若学生投入最小努力且不尝试学习知识,完全依赖ChatGPT可获得B级成绩通过课程。问题在于这种及格成绩可能是简单数学题A+与分析题D-的组合,实际并未掌握多少知识。
普图马拉尼兰的导师梅尔基奥·奥尔尼克指出:"如同数学课的计算器,ChatGPT已成为学生将持续使用的工具。这项研究向我指明,作为教育者需要调整教学策略。我计划重新设计课程体系,逐步增加高阶问题比例,可能引入项目制作业。学生仍会用ChatGPT解决基础数学题,但通过增加开放性问题,他们将提升批判性思维层次,真正掌握知识。"
普图马拉尼兰强调,尽管ChatGPT在结构化问题上反应迅速且多数正确,仍需谨慎使用。
"学生可能需要20分钟解答的问题,ChatGPT在20秒内就能完成,但其正确性时常存疑。"
他描述了ChatGPT作业中的异常表现案例,包括使用不当技术术语及编造虚假陈述。
"尽管我们向ChatGPT提供了全部课程资料,它仍产生幻觉——使用了课堂、讲座及教材中从未出现的'准周期振荡'等术语。"
研究针对选择最小努力投入的学生类型。普图马拉尼兰指出付费版ChatGPT可能略擅长解决分析性问题,且具备更大内存处理复杂问题。研究者选用免费版是因普通学生通常不愿支付月费。
普图马拉尼兰申明:本课程不含小组作业,ChatGPT接收的题目表述与学生完全一致,且所有测试同步进行。
"当学生在做作业时,ChatGPT也在同步完成作业。它就像班级里的特殊学生。"
ChatGPT能否从错误中学习?
"当告知ChatGPT它在选择题答错并给出正确答案后,面对同类变体题时表现确有提升。某种意义上它在学习,但整体进步停滞。若作业得分为90%,学期末成绩仍在90%或92%。"
本研究由伊利诺伊大学厄巴纳-香槟分校格兰杰工程学院"工程教学促进基金"支持。航空航天教授蒂姆·布雷特尔与博士生格雷森·谢尔、普拉奈·坦格达共同创建项目环境,开发课程材料及PrairieLearn教学平台基础设施。
Story Source:
Materialsprovided byUniversity of Illinois Grainger College of Engineering. Original written by Debra Levey Larson.Note: Content may be edited for style and length.
Journal Reference:
Gokul Puthumanaillam, Melkior Ornik.The Lazy Student's Dream: ChatGPT Passing an Engineering Course on Its Own.Submitted to arXiv, 2025 DOI:10.48550/arXiv.2503.05760
2025-07-02
2025-07-02
2025-07-02
2025-07-02
2025-07-02