使用ChatGPT，学生或许能通过一门课程，但需付出代价

研究人员假设学生会使用ChatGPT等人工智能和大语言模型完成作业，于是着手评估免费版ChatGPT在整个学期的本科控制系统课程中与人类学生表现的对比情况。

测试结果：在基础数学作业中，ChatGPT获得A级评分，但存在一些古怪答案。而在需要推理能力的高阶问题上，它只得到D级成绩。

"我们发现ChatGPT技术能完美解决结构化基础题，但在开放式问题上仅得62分，使其学期总评降至82分（B-）。人类学生的班级平均分为84.85%，因为他们能处理需要高阶推理的问题。"博士生戈库尔·普图马尼拉姆解释道。

研究结论表明，不愿投入学习的最低限度努力型学生，若完全依赖ChatGPT可获得B等成绩通过课程。问题在于这种及格成绩可能是简单数学题A+与分析题D-的组合，实际并未掌握多少知识。

"就像数学课上的计算器，ChatGPT将成为学生持续使用的工具。这项研究启示我作为教育者需要调整教学策略。"普图马尼拉姆的导师梅尔基奥尔·奥尔尼克表示，"我计划重新设计课程体系，逐步增加高阶问题比重，可能引入项目制作业。学生仍会用ChatGPT解决基础题，但通过增设开放式问题，他们将提升批判性思维水平，真正掌握知识。"

普图马尼拉姆指出，虽然ChatGPT解答结构化问题时快速且基本准确，仍需谨慎使用。

"学生可能需要20分钟解题，ChatGPT在20秒内就能完成，但答案正确性存疑。"

他列举了ChatGPT作业中的异常表现案例，包括使用不当的专业术语和明显错误的陈述。

"尽管我们向ChatGPT提供了全部课程资料，它仍会产生'幻觉'，使用课程中从未出现过的术语，比如准周期振荡这类词汇。"

研究针对的是最低努力型学生群体。普图马尼拉姆表示付费版ChatGPT可能略微擅长解决分析性问题，并能存储更多记忆处理复杂问题。研究者选择免费版本是因普通学生通常不愿支付月费。

普图马尼拉姆强调，该课程不含小组作业，ChatGPT接收的题目表述与人类学生完全一致，且所有测试同步进行。

"当学生在写作业时，ChatGPT也在同步完成作业。它就像是班级里的特殊学生。"

ChatGPT会从错误中学习吗？

"当我们指出其选择题错误并给出正确答案后，面对同类题型变体时，它的确有所改进。某种程度上它在学习，但整体进步有限。如果作业得分是90%，学期末最终成绩仍在90-92分区间。"

本研究由伊利诺伊大学厄巴纳-香槟分校格兰杰工程学院"工程教学促进资助计划"支持。航空航天工程教授蒂姆·布雷特尔与博士生格雷森·谢尔、普拉奈·坦格达共同搭建了项目环境，开发课程材料及PrairieLearn教学平台。