大模型在数学、语文和英语考试中的表现差异

讯飞星火2yrs ago (2023)update lida

185 0 0

文章主题：数学题测试, 媒体, 大模型, 数学能力

站长之家 6月9日消息:今日，科大讯飞举办了讯飞星火认知大模型V1.5升级发布会，正式推出了新版本。会上，科大讯飞展示了大模型在今年高考中的答题能力，讯飞星火凭借出色表现成为了答题正确率最高、“最聪明”的AI大模型。

打开凤凰新闻，查看更多高清图片

在一场针对数学题目的测试中，媒体选择了高考数学试卷的前十道填空题，分别邀请百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑以及ChatGPT来解答。经过分析，测试结果揭示了这五款大模型在处理数学题目时的表现存在明显差异。其中，讯飞星火表现最为出色，成功解答了5道题目，正确率达到了50%，因此成为了大模型中数学能力最强的选手。紧随其后的是百度文心一言和ChatGPT，这两款大模型分别答对了4道题目，正确率为40%。总的来说，在这场数学题目的测试中，讯飞星火认知大模型展现了卓越的数学能力，而百度文心一言和ChatGPT也取得了不错的成绩。然而，360智脑在此次测试中的表现相对较差，未能解答出任何一道题目。

在语文主观作答方面，ChatGPT的得分表现最为优秀，文心一言和讯飞星火的得分虽然稍逊一筹，但两者处于相近的水平。而在英语考试领域，讯飞星火和ChatGPT则展现出了明显的优势，远超其他模型。

数学题测试, 媒体, 大模型, 数学能力

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！