文章主题:讯飞星火, 大模型评测, 国产大模型, 人工智能
历经多次迭代升级,讯飞星火现正式上线!
近期,讯飞星火认知大模型V2.0因其卓越的表现和高精度的预测能力,在MIT科技评论发布的我国大模型评测中,成功夺得了最高分数,荣膺“最聪明”的国产大模型美誉。值得一提的是,讯飞星火APP于9月5日正式向公众开放,让广大用户能够抢先体验这款被誉为“最聪明”的国产大模型的强大功能。
MIT科技评论全面审视了大型模型研发与商业化的实力、社会舆论的态度以及未来发展趋势等多方面因素,从而选定四家具有代表性的中文大模型平台进行了全方位、科学性的评估。评估所使用的测试集包含600道题目,覆盖了语言技能、数学知识、理科综合、文科综合、逻辑思维、编程技术、综合知识以及安全性等八个主要类别,共126个二级分类和290个三级标签。
在众多评测维度中,讯飞星火的表现独树一帜,堪称卓越。在语言专项评测中,其得分为85.73%,位居行业之首;在数学专项评测中,得分为77.75%,同样稳居第一宝座;在理科综合评测中,以78.50%的得分率独领风骚;在逻辑思维评测中,得分为81.25%,成绩斐然。此外,在编程能力和综合知识方面,讯飞星火也表现优异,分别获得了80%和80.61%的高分,堪称领导者。特别是在数学评测中,讯飞星火以77.75%的得分率遥遥领先于其他平台,尤其是在几何和情景应用方面的表现更是令人瞩目。
科大讯飞是目前在全民开放大模型领域首个符合条件的A股上市公司。该公司在今年5月6日正式推出了“讯飞星火认知大模型”,并在同年6月9日、8月15日分别发布了讯飞星火V1.5和V2.0版本,这些版本均成功突破了代码能力和多模态能力的限制。
作为一款具备强大核心能力的智能编码助手iFlyCode1.0,以及讯飞智作2.0、教育数字基座应用开发助手、星火教师助手、星火语伴2.0和AI学习机等一系列丰富应用和产品的支持,科讯飞正在不断拓宽其服务领域。此外,该公司还与华为共同推出了星火一体机,为企业提供了打造个性化大规模模型的可能。
值得一提的是,科大讯飞表示,到今年10月24日,讯飞星火将实现通用模型对标ChatGPT 3.5的目标。这意味着讯飞星火在中文能力方面将超越ChatGPT 3.5,在英文能力方面相当。返回搜狐,查看更多
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!