讯飞星火认知大模型V3.0：全面对标ChatGPT4，中文能力客观评测超越对手

讯飞星火2yrs ago (2024)update lida

163 0 0

文章主题：科大讯飞 AI 大模型, 升级, 华为, 升华

本报记者陈佳岚合肥报道

科大讯飞AI大模型的发展再次迈出了重要一步。据《中国经营报》报道，科大讯飞星火认知大模型于10月24日升级至3.0版本，其七大核心能力得到了显著提升。此外，科大讯飞还与华为联手，共同推出了基于昇腾生态的“飞星一号”大模型算力平台。这一举措展示了我国人工智能领域的强大实力和发展潜力。

5月6日，我国知名科技公司科大讯飞，成功发布了一款名为“星火认知大模型”的产品，并立即向公众展示了其在文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力和多模态等多个领域的能力。仅仅一个月后的6月9日，科大讯飞再次推出升级版的“星火认知大模型V1.5”，其中开放式知识问答、逻辑推理和数学以及多轮对话等能力的表现都得到了显著提升。而在8月15日，科大讯飞继续对“星火认知大模型”进行升级，达到了V2.0版本，这次升级主要体现在代码技术和多模态能力的提升上。

在成功追平 ChatGPT 3.5 的壮举之后，科大讯飞董事长刘庆峰立即设定了一个更高远的目标，即在 2024 年上半年，讯飞星火大模型将挑战 C

已对标ChatGPT 3.5

据记者报道，讯飞星火认知大模型V3.0在多个领域取得了显著进展。在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力等方面，该模型都实现了持续改进。

在“科大讯飞2023全球1024开发者节”上，刘庆峰宣布，星火认知大模型V3.0已经全面提升与ChatGPT（GPT 3.5）的竞争力，其在中文能力方面的客观评测已经超过了ChatGPT，而在英文能力方面，其表现也与国际顶尖水平相媲美，与ChatGPT 48项任务的结果相当。

国研经济研究院的横向评估报告揭示，星火大模型3.0版的综合性能已经超过了ChatGPT。在医学、法律、教育、零售、汽车工程、计算机以及工业设计等领域，该模型的表现尤为抢眼，准确率分别达到了69.3%、71.4%、82.2%、61.2%、78.4%、76.9%和66.4%。这一结果充分展示了星火大模型3.0版在多行业应用中的强大实力和广泛潜力。

据OpenAI在其官网发布的英文任务测试集测试数据，星火认知大模型V3.0在48项任务中与ChatGPT结果相当，已经做到了85.1%，略微领先ChatGPT的84.3%；而在《通用认知智能大模型评测体系》构建测试集测试中，星火认知大模型V3.0中文能力客观评测超越ChatGPT。

不过，刘庆峰也提到，国产大模型必须正视和ChatGPT 4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距ChatGPT 4还有差距。”他表示，唯有实事求是的科学精神，才能真正实现超越。

此前，科大讯飞已联合华为推出了讯飞星火一体机，开始布局大模型算力，重视算力安全，性能已可对标英伟达A100。在1024全球开发者节现场，科大讯飞又联合华为发布基于昇腾生态的“飞星一号”大模型算力平台。

刘庆峰透露，在此基础上，讯飞星火大模型将开启对标GPT 4的更大规模训练。科大讯飞的目标是大模型在2024年上半年实现对标ChatGPT 4。

事实上，与华为合作布局算力平台，科大讯飞也需要克服很多难点，“原本用英伟达可能一个月就能干成的事情，现在使用华为会面临更多不确定性因素，可能需要三个月才能完成，科大讯飞不仅要大规模投入、‘磨炼武器’,还要盈利，同时面临市场竞争。”刘庆峰对记者坦陈，使用国产算力平台意味着大模型在起步阶段可能需要更长的训练时间，但这是中国发展自主可控大模型的必经之路。

“从早期的国产操作系统到现在的国产算力平台，都是需要打磨，从不好用到好用再到生态的繁荣的过程，如果谁都不往前走一步，没有能够坚定提供底座的厂商，国家始终是没有办法自立自强。”刘庆峰表示，科大讯飞最早期会使用一部分英伟达的算力，现在正在逐步将算力完全替换，主要使用国产平台。

刘庆峰透露，讯飞星火大模型从V3.0版本后都会在华为算力平台上训练。

明年仍将加大投入

不过，在不断加大对大模型投入的同时，也在一定程度上影响到了科大讯飞最近一个季度的净利润表现。

科大讯飞刚刚发布的三季度财报显示，对大模型投入成为其当季利润下滑的主因。面对投入大模型带来的业绩阵痛，外界感慨：大模型太“烧钱”了。

科大讯飞三季报显示，前三季度实现营业收入126亿元，同比略微下滑0.27%；归属于上市公司股东的净利润9936万元，同比下滑76%。其中，第三季度净利润仅为2579万元，同比下滑82%。

对于净利润的大幅下滑，科大讯飞表示，主要原因系公司积极抢抓通用人工智能的历史新机遇，在通用人工智能认知大模型等方面坚定投入。前三季度科大讯飞开发支出逾10亿元，同比增长约44%，公司表示这“主要系本期研发投入增加所致”。另外，由于项目投入周期增加长期借款补充流动资金，科大讯飞长期借款较期初增长69.64%至29亿元。

科大讯飞表示，尽管上述投入一定程度上影响了当期利润，但为公司在数字经济时代长期可持续发展奠定了坚实基础和难得的先发优势：一方面，使公司在人工智能赋能教育医疗等民生事业、赋能千行百业的数字化、智能化转型过程中强化了领先优势，同时也为公司在人工智能时代打造每个人的AI助手、开拓更广阔的C端消费产品市场带来全新机会。

而科大讯飞对大模型的投入短期之内是否仍将保持这样的投入水平？刘庆峰向记者表示，“目前阶段大模型仍有很多工作要做，科大讯飞仍在只争朝夕落地产品，明年仍会是强投入。”

不过，刘庆峰看好明年大模型带来的商业收益及毛利提升，也将带来行业市场份额和影响力的提升。

“而科大讯飞新增的毛利也会坚定不移地投入大部分新研发中，明年仍不一定要实现投入产出平衡。”刘庆峰表示，“明年至2025年，科大讯飞将会处于良性状态，收入、毛利快速增长后，能够覆盖新增投入。”

而事实上，目前几乎所有的大模型公司处于投入阶段，不管是科大讯飞还是百度、阿里、腾讯无一例外在疯狂“烧钱”加码大模型投入。在互联网分析师丁道师看来，“大模型是人工智能发展到今天最值得关注的一个领域，赋能金融、医疗、教育、政务、创作等众多行业，进而实现降本增效，所以国内有实力的企业都愿意不计成本地投入。”

“对于当前的大模型企业来说，目前都处于战略性投入阶段，战略性投入是为了将来的战略性盈利。”丁道师对记者表示，当下盈利对于大模型公司来说并没有这么着急，当前所有的大模型企业都在抢跑，打好基础反而更重要。

丁道师认为，这些公司的大模型什么时候能够改善业绩情况还要看大模型商用落地情况，能进入多少个行业、有多少企业买单，谁能最快在B端市场拿到更多单子，至少在很长一段时间里大模型要想实现多盈利，最先取得突破的一定是B端市场，然后才是C端市场。

举报/反馈