文章主题:科大讯飞, 星火大模型, 人工智能, 机器学习
导语
短短半年时间,AI 头部玩家们已纷纷推出自己的大模型产品,并迅速展开竞争。业界关注的焦点也从“谁能开发出中国版ChatGPT”到“谁能真正对标 ChatGPT”。6 月 9 日,科大讯飞星火大模型迎来发布后的首次大更新,距离其设定的“ 10 月 24 日与 ChatGPT 对标”的目标又近了一步。
1
比“炫技”更重要的是变现
在 5 月 6 日的首场发布会后,科大讯飞就星火大模型今年后续的规划给出了三步走的答案:
在 6 月 9 日的一则重要更新中,我们成功实现了开放式问答的突破,借助于类搜索插件,我们能更加高效地获取并整合知识信息。同时,我们也对多轮对话能力进行了全面升级,使得系统在处理复杂问题时能够展现出更加强大的数学能力,再次证明了我们在人工智能领域的领先地位。
在 2023 年的 8 月 15 日,我们致力于提升我们的代码能力,以实现更高效、便捷的使用体验。目前,讯飞内部的开发者以及合作伙伴已经能够享受到我们优化后的代码生成功能带来的便利。此外,我们也正式将多模态交互能力向客户开放,以满足他们在不同场景下的需求。
在10月24日的科大讯飞全球开发者节上,我们展示了科学且系统化的评测方法,旨在评估通用认知大模型在能力上是否可以与ChatGPT相媲美。尤其是在中文方面,我们的表现更是超越了ChatGPT;而在英文方面,我们的表现也达到了与ChatGPT相当的水平。
在科大讯飞的首场发布会之后,其T20和T20Pro两款学习机成为了首个实现星火大模型落地的产品。在产品的介绍页面中,科大讯飞详细标出了这两款学习机的三大升级功能:中英作文类人批改、数学类人互动辅学以及英语类人口语对话。
在此次发布会上,星火大模型的多轮对话和数学能力得到了升级,此外,模型的“文本生成”“语言理解”“逻辑推理能力”都得到了持续提升。数据显示,星火认知大模型V1.5文本生成能力提升7%,语言理解能力提升8%,知识问答能力提升24%,逻辑推理能力提升10%,数字能力提升9%,代码能力提升8%。
在科大讯飞举办的发布会上,一场别开生面的数学题测试环节上演。本次测试的主要内容是选取了高考数学试卷的前十道填空题,邀请市面上当前最为主流的AI大模型们进行解答。经过一番“较量”之后,测试结果揭晓,五大AI大模型在数学题解答上的表现呈现出明显的差异。其中,讯飞星火的表现尤为抢眼,成功答对了五道题目,正确率达到了50%,成为了大模型们在数学题能力上的佼佼者。紧随其后的是ChatGPT,其答题准确率也为40%,实力不容小觑。这场测试充分展示了人工智能技术在数学领域的应用成果,也让我们对AI大模型的智能水平有了更为直观的认识。然而,在未来的发展中,AI大模型们还需不断优化算法,提升自身在数学题解答等方面的精准度,以更好地服务于广大学子和社会大众。
在语文主观作答方面,ChatGPT的表现最为出色,其高考作文得分远高于讯飞星火,尽管讯飞星火的得分也相对较高,且两者处于相同的水平。而在英语考试中,讯飞星火和ChatGPT则展现出了明显的优势,相较于其他模型,它们的表现更为突出。
值得关注的是,此次发布会上,科大讯飞还推出了星火语伴APP,这是科大讯飞星火认知大模型在教育领域的进一步落地。
科大讯飞所推出的星火语伴是一款卓越的外语学习工具,它能提供1对1的口语陪练和随身翻译服务,助力用户在外语学习道路上取得更大的进步。此外,该产品还具备生成虚拟人的功能,能与用户进行实时对话,让他们身处更为真实的环境中进行语言实践,从而提升学习效果。
除此之外,借助最新推出的星火助手中心,用户将能够在特定的场景下,与星火大模型进行更为高效便捷的互动。星火大模型以其强大的能力,能够深入理解并满足用户的需求,从而提供更为个性化、智能化的高质量服务。
科大讯飞称,星火大模型的落地,有效提升了其产品的销售表现。数据显示,科大讯飞AI学习机系列在 6 月第一周激活同比增长 214%;智能办公本系列同比增长 176%;听见网站新增用户同比增长 205%。
此前,科大讯飞就在第一场发布会中表示,讯飞星火将在教育、办公、汽车、数字员工四个领域寻找应用方向,与讯飞旗下教育产品AI学习机以及办公产品讯飞听见、讯飞智慧屏相结合,寻找落地场景。但能否真的依靠这些硬件和APP实现长期稳定的收入,还有待于未来进一步的观察。
2
大模型,科大讯飞必须打赢的一仗
在星火大模型发布的这一个月里,科大讯飞过得并不轻松。
首场发布会后不久,就有网友提出,讯飞星火大模型在部分问答中会出现“我是由OpenAI 开发的”等内容,由此引发了“讯飞星火大模型套壳ChatGPT”的舆论。
5月11日,科大讯飞在最新披露的投资者关系活动记录表中表示,星火大模型“套壳ChatGPT”既不符合事实,也不符合逻辑。如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比ChatGPT还快,更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。
5月24日,科大讯飞午后股价跳水,盘中跌幅一度超过9%。当日收盘报56.57元/股,收跌4.26%。而股价跳水的起因,源于一篇由文心一言生成的小作文。文章称,“讯飞可能通过其语音识别服务非法获取了用户的个人信息,并将其用于研究”“严重侵犯了用户的隐私权,引发了公众的强烈不满和抵制”,由此引发了科大讯飞和百度之间的口水战。
(图源来自互联网)
科大讯飞表示,使用大模型编造虚假信息属于违法行为,将受到法律制裁。当前已有刑事案例。“对于恶意抹黑、捏造虚假信息,损害我司名誉权的机构或个人,公司会借助法律武器保护公司和投资者利益。”
百度的负责人则表示,“要把精力放在正事儿上,请友商解决好自己的问题,别动不动就碰瓷别人。”
(图源来自网络)
争吵背后,一场 AI 大模型的军备竞赛已然开启。
从技术层面上来看,百度和科大讯飞都是都在 AI 赛道进行了长期投入,拥有强大的技术实力和研发团队,也都对 AI 大模型寄予厚望。
不过,在AI的基础层——算力和数据上来看,相比拥有海量中文搜索数据和昆仑芯支持的百度,科大讯飞并不具备绝对的优势。面对投资者的疑问,科大讯飞在前不久表示,现在星火大模型和国内主流芯片厂商都有相关合作,目前讯飞的算力能够满足大模型的训练。
可以预见的是,在AI大模型持续“烧钱”的当下,商业化变现将是众多AI企业在下一阶段面对的难题,这对于刚刚终结10年业绩增长神话,急需找到新的增长点的科大讯飞尤甚。
– END –
更多精彩内容
鲸推荐
● 用户70%上以是学习场景是练习场景,小猿学练机如何顺势而为?
科大讯飞, 星火大模型, 人工智能, 机器学习
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!