Nature News journal Score 60

AI评分编程作业靠谱吗?

研究人员尝试用ChatGPT自动批改本科生编码作业,发现了哪些优势和局限?

Yulu Hou及其合作者进行了一项实验,使用ChatGPT自动批改本科生的编程作业。他们发现,ChatGPT在评分方面具有快速和一致的优点,但在处理复杂逻辑和创意性代码时,其准确性有待提高。

实验结果表明,AI评分可以作为辅助工具,但完全取代人工评审仍不可行。特别是在涉及代码风格、算法创新等主观评判方面,AI的局限性明显。

研究人员建议,将AI评分与教师抽查结合,可提高效率同时确保质量。这一发现为教育领域应用AI提供了实践参考,但仍需进一步测试和优化。

AIeducationcoding