测试结果:在基础数学作业中,ChatGPT获得A级评分,但存在一些古怪答案。而在需要推理能力的高阶问题上,它只得到D级成绩。
"我们发现ChatGPT技术能完美解决结构化基础题,但在开放式问题上仅得62分,使其学期总评降至82分(B-)。人类学生的班级平均分为84.85%,因为他们能处理需要高阶推理的问题。"博士生戈库尔·普图马尼拉姆解释道。
研究结论表明,不愿投入学习的最低限度努力型学生,若完全依赖ChatGPT可获得B等成绩通过课程。问题在于这种及格成绩可能是简单数学题A+与分析题D-的组合,实际并未掌握多少知识。
"就像数学课上的计算器,ChatGPT将成为学生持续使用的工具。这项研究启示我作为教育者需要调整教学策略。"普图马尼拉姆的导师梅尔基奥尔·奥尔尼克表示,"我计划重新设计课程体系,逐步增加高阶问题比重,可能引入项目制作业。学生仍会用ChatGPT解决基础题,但通过增设开放式问题,他们将提升批判性思维水平,真正掌握知识。"
普图马尼拉姆指出,虽然ChatGPT解答结构化问题时快速且基本准确,仍需谨慎使用。
"学生可能需要20分钟解题,ChatGPT在20秒内就能完成,但答案正确性存疑。"
他列举了ChatGPT作业中的异常表现案例,包括使用不当的专业术语和明显错误的陈述。
"尽管我们向ChatGPT提供了全部课程资料,它仍会产生'幻觉',使用课程中从未出现过的术语,比如准周期振荡这类词汇。"
研究针对的是最低努力型学生群体。普图马尼拉姆表示付费版ChatGPT可能略微擅长解决分析性问题,并能存储更多记忆处理复杂问题。研究者选择免费版本是因普通学生通常不愿支付月费。
普图马尼拉姆强调,该课程不含小组作业,ChatGPT接收的题目表述与人类学生完全一致,且所有测试同步进行。
"当学生在写作业时,ChatGPT也在同步完成作业。它就像是班级里的特殊学生。"
ChatGPT会从错误中学习吗?
"当我们指出其选择题错误并给出正确答案后,面对同类题型变体时,它的确有所改进。某种程度上它在学习,但整体进步有限。如果作业得分是90%,学期末最终成绩仍在90-92分区间。"
本研究由伊利诺伊大学厄巴纳-香槟分校格兰杰工程学院"工程教学促进资助计划"支持。航空航天工程教授蒂姆·布雷特尔与博士生格雷森·谢尔、普拉奈·坦格达共同搭建了项目环境,开发课程材料及PrairieLearn教学平台。
Story Source:
Materialsprovided byUniversity of Illinois Grainger College of Engineering. Original written by Debra Levey Larson.Note: Content may be edited for style and length.
Journal Reference:
Gokul Puthumanaillam, Melkior Ornik.The Lazy Student's Dream: ChatGPT Passing an Engineering Course on Its Own.Submitted to arXiv, 2025 DOI:10.48550/arXiv.2503.05760
2025-08-17
2025-08-17
2025-08-17
2025-08-17
2025-08-17