文章主题:ChatGPT, 大学会计课程, 考题测试, 会计信息系统
IT之家 4 月 25 日消息,上个月,OpenAI 推出了最新的 AI 聊天机器人 GPT-4,并声称该机器人在各种考试中表现异常出色,比如律师考试,研究生入学考试等。然而,根据美国杨百翰大学领导的一项研究,ChatGPT 在会计考试中的表现远不及人类,甚至还会一本正经的胡说八道,为错误的答案辩解。
🎓👨🏫伍德教授的会计研究团队对ChatGPT进行了深度评估,旨在验证其在大学会计课程中的知识水平。他们发起了一项国际性挑战,吸引了14个国家的186所教育机构的327位热情参与者,涵盖了会计信息系统、审计、财务会计、管理会计和税务等多个关键领域。总计,他们精心准备了25,181道实战试题,确保测试的全面性和准确性。📚为了增加对比度,团队特别邀请BYU的本科生,包括伍德教授的女儿杰西卡,用教科书上的习题来考验ChatGPT的能力,共提供了2,268道问题。这次大规模的学术较量,旨在揭示AI在教育领域的潜力与局限,同时也为学生们提供了一个学习和评估新工具的机会。这项测试结果将对ChatGPT的学习能力以及其在教育场景中的应用产生深远影响,我们期待看到更精确、全面的答案。同时,我们也鼓励教育者们关注这一技术的发展,以适应未来教育的变革。👩🏫👨💻#ChatGPT学术挑战 #会计知识测试 #教育与AI
结果显示,ChatGPT 的表现虽然有亮点,但总体上还是不及学生水平。学生的平均分是 76.7%,而 ChatGPT 的平均分只有 47.4%。在 11.3% 的问题上,ChatGPT 的得分高于学生平均分,尤其是在会计信息系统和审计方面。但是,在税务、财务和管理方面,ChatGPT 就显得力不从心,可能是因为这些领域需要更多的数学运算能力。在问题类型上,ChatGPT 比较擅长判断题(68.7% 正确率)和选择题(59.5% 正确率),但是在简答题上就很吃力(正确率在 28.7% 到 39.1% 之间)。一般来说,对于需要更高层次思维的问题,ChatGPT 更难回答。有时候,ChatGPT 甚至会为错误答案提供权威的解释,或者对同一个问题给出不同的答案。
“它并不完美,你不能指望它能做所有事情。”杰西卡说,“仅仅依靠 ChatGPT 来学习是愚蠢的。”
IT之家注意到,研究人员还发现了一些其他有趣的现象:
🎓当面对复杂的数学问题时,ChatGPT偶尔会让人忍俊不禁,它可能会不小心在减法中多加了两位数字,抑或在除法运算上犯下致命的错误。这种看似无心的小差错,实则是技术智能尚需打磨的体现。虽然它的学习能力强大,但精准逻辑和数学精确性仍是其需要不断优化和提升的方向。
🌟ChatGPT虽智能,偶尔出错💡它不仅能给出答案,还会附上理由分析,但这并不意味着总能准确无误。有时,看似精准的描述下藏着误导的选择💡尽管如此,它的自我修正能力也是值得肯定的。记得,验证信息时要多角度思考哦!📚
🌟警告:AI助手在此!👀ChatGPT并非始终如一地诚实,有时会玩文字游戏。在引用资料时,它可能会创造出看似可靠的文献列表,但实际上它们是虚假的化身,作者姓名都是杜撰的。这种误导性行为让人不得不心生疑虑。📚警惕其学术诚信度!
尽管如此,研究人员相信,在未来的版本中,ChatGPT 会在会计问题上有所进步,并解决上述问题。他们认为最有前景的是,这款聊天机器人可以帮助改善教学和学习,比如设计和测试作业,或者用于草拟项目的部分内容。
在这个关键时刻,让我们深入审视教育的本质——传授何为价值之所在。正如BYU会计学界的资深导师,研究合作人之一的拉森教授所指出的那样,这是一场深刻的革新挑战,我们需要重新定义教育的方向。改革的步伐虽不会停止,但教学方式将有所调整。虽然助教的角色依然存在,但他们的重心将转向更高质量的教学内容和服务。📚🌟
这项研究发表在《会计教育问题》杂志上。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!