结果:在基础数学作业上,ChatGPT获得了A级评分,但部分答案存在古怪之处。然而,在需要推理能力的高阶问题上,它仅获得D级评分。
博士生戈库尔·普图马尼拉姆指出:"我们发现ChatGPT技术能在结构化基础题上获得A级评分。但在开放性问题中仅得62分,导致其学期总评降至82分(B级下游)。人类学生的班级平均分为84.85%,因为他们能处理需要高阶推理的问题。"
研究结论表明:投入最少努力、完全不想学习课程内容的学生,若全程使用ChatGPT可获得B级评分并通过课程。问题在于,这种及格成绩可能是简单数学题A+与分析题D-的组合产物,学生并未真正掌握知识。
普图马尼拉姆的导师梅尔基奥尔·奥尼克表示:"如同数学课上的计算器,ChatGPT已成为学生将长期使用的工具。这项研究结果启示我作为教育者需要调整教学策略。我计划重新设计课程体系,逐步增加高阶问题比重,可能引入项目制作业。学生仍会用ChatGPT处理简单数学题,但通过增加开放式问题,他们将提升批判性思维能力并真正掌握知识。"
普图马尼拉姆强调,尽管ChatGPT在结构化问题上快速且基本正确,仍需谨慎使用。
"学生可能需要20分钟解答的问题,ChatGPT在20秒内就能完成,但其答案的正确性有时存疑。"
他还描述了ChatGPT作业中的异常行为案例,包括使用不恰当的专业术语及编造虚假陈述。
"尽管我们向ChatGPT提供了全部课程资料,它仍会产生幻觉,使用诸如'准周期振荡'这类课程、讲座或教材中从未出现的术语。"
本研究针对选择最小化学习投入的学生类型。普图马尼拉姆指出,付费版ChatGPT可能稍强于解决分析性问题,其更大内存容量可处理更复杂的长期问题。研究者选用免费版本是因普通学生通常不愿支付月费。
普图马尼拉姆说明:该课程无小组作业,ChatGPT使用的提示语与人类学生完全相同,且所有测试均为同步进行。
"当学生完成作业时,ChatGPT也在同步完成。它就像课堂里的特殊学生。"
ChatGPT能否从错误中学习?
"当告知多选题错误并给出正确答案后,再出现同类变体题时,它的确表现更好。某种意义上它在学习,但整体进步停滞。若作业得分为90%,学期末仍维持在90%或92%。"
本研究由伊利诺伊大学厄巴纳-香槟分校格兰杰工程学院"工程教学促进基金计划"资助。航空航天工程教授蒂姆·布雷特尔与博士生格雷森·谢尔、普拉奈·坦格达共同创建了项目环境,开发课程材料及PrairieLearn教学平台基础设施。
Story Source:
Materialsprovided byUniversity of Illinois Grainger College of Engineering. Original written by Debra Levey Larson.Note: Content may be edited for style and length.
Journal Reference:
Gokul Puthumanaillam, Melkior Ornik.The Lazy Student's Dream: ChatGPT Passing an Engineering Course on Its Own.Submitted to arXiv, 2025 DOI:10.48550/arXiv.2503.05760
2025-08-04
2025-08-04
2024-01-23
2024-01-23