国产大模型讯飞星火的崛起：重塑未来的竞争力

讯飞星火2yrs ago (2023)update lida

181 0 0

文章主题：重塑未来, 讯飞星火, 大模型, AI提示工程师

原标题：重塑未来！讯飞星火领跑国产大模型？

互联网曾经近乎重写了所有行业，通讯、购物、支付、打车、点餐等等，人们生活的方方面面几乎被重塑。

如今大模型再次给予人们充分的想象空间。

原内容提到了ChatGPT在取代一些重复性和规律性较高的工作方面具有潜力，同时也能释放更多生产力，引导人们关注更具想象力和情感的部分。这有望催生诸如AI提示工程师、AI调教师和AI创意师等新兴职业。基于此，我们可以认为ChatGPT的广泛应用将对传统职业产生影响，并催生一系列新兴职业，从而改变劳动力市场的格局。

大模型可以被看作是一个全新的系统,具有广泛的应用前景。这个系统能够降低许多行业的门槛,使得更多的人能够参与到相关产品的构建中。在未来,随着大模型的应用越来越广泛,人们将会发现更多的创造性劳动可以通过这个系统得到释放,从而大大提高生产效率和产品质量。

在我国科技信息研究所的不完全统计数据中，目前我国已经成功研发出70多个大型人工智能模型，这些成果在实际应用中表现出了令人瞩目的性能。

以科大讯飞为例，其在基于讯飞星火认知大模型研发的学习机和办公本等产品上市后，今年再次展现出强劲的增长势头，618期间的销售额同比增长达到了125%，同时也在多个品类的销售中脱颖而出，荣获销售额冠军的荣誉。

这一点，同样体现在资本市场。6月20日，AI概念股表现抢眼，科大讯飞涨近7%，复权股价同样创历史新高。科大讯飞成交102亿元，在两市居首。

作为一名文章写作高手，我将运用我的专业素养对原文进行改写。在准备好之后，我将分享我对AI大模型的最新观察和分析。

错别字识别哪家强

高考作文想必大家都看腻了，前阵子看到《智商税研究中心》的这篇校对测评的设问还挺特别。

篇幅有限，拎出几个比较能拉开差距的问题，来跟大家一起分享看看。

首先是字词方面。

“洛阳亲友如相问，就说我在岳阳楼。”将“相问”错拼成“翔问”，考验一下各家大模型的基本功。

讯飞星火：

国产大模型讯飞星火的崛起：重塑未来的竞争力

文心一言：

国产大模型讯飞星火的崛起：重塑未来的竞争力

通义千问：

国产大模型讯飞星火的崛起：重塑未来的竞争力

360智脑：

国产大模型讯飞星火的崛起：重塑未来的竞争力

GPT4：

国产大模型讯飞星火的崛起：重塑未来的竞争力

讯飞星火、文心一言、通义千问、GPT4都顺利完成基础的校对，只有360智脑，追问之下仍表示无误。

再来看语病方面。

在众多语病校验示例中，其总体表现不尽如人意，然而，对于AI算法而言，能够直观地辨别出语句中的歧义。这或许便是我国自主开发的AI大模型与其他国际先进技术之间存在的一丝差距。

例如，“这句话有歧义吗：在床上‘葛优瘫’了一天，他突然想起来了。”

讯飞星火：

国产大模型讯飞星火的崛起：重塑未来的竞争力

文心一言：

国产大模型讯飞星火的崛起：重塑未来的竞争力

通义千问：

国产大模型讯飞星火的崛起：重塑未来的竞争力

360智脑：

国产大模型讯飞星火的崛起：重塑未来的竞争力

GPT4：

国产大模型讯飞星火的崛起：重塑未来的竞争力

在这场灾难中，大部分军队已经遭受重创，但讯飞星火却敏锐地指出了“可能存在一些解释上的模糊性”。尽管GPT4一直表现出卓越的性能，但在这种情况下未能察觉到这些潜在的歧义，仍然让人感到有些意外。

最后看下指正校对错误后，AI大模型能否承认错误接受指正。

讯飞星火：

国产大模型讯飞星火的崛起：重塑未来的竞争力

文心一言：

国产大模型讯飞星火的崛起：重塑未来的竞争力

通义千问：

国产大模型讯飞星火的崛起：重塑未来的竞争力

360智脑：

国产大模型讯飞星火的崛起：重塑未来的竞争力

GPT4：

国产大模型讯飞星火的崛起：重塑未来的竞争力

在比较中，我们发现讯飞星火的性能与GPT4相当，其反应速度快且简洁明了。当犯错时，它能够直接给出校对的句子，而不需要额外的指令。相比之下，文心一言需要进一步的指示才能给出答案，而通义千问和360智脑则表现出“积极认错，坚决不改”的态度。

校对文本错误在某种层面上，反映了大模型的基础能力，地基打好了，才能有更多上探的空间。

总体来说，在基础的校对能力上，讯飞星火算是国产大模型中最接近GPT4水平的；其他表现也中规中矩；至于360智脑，用360掌门人周鸿祎在360首发时的话来说，360智脑还只是个“孩子”，距离完善使用还有相当的一段路要走。

“数学高手”

寒窗苦读十余年，无论教育制度怎么改，除了语文，还有一个怎么也躲不掉的，就是数学。

数学的重要性不言而喻，它培养了我们的逻辑思维能力。但相对于大模型擅长的文本内容，数学能力在一定程度上算是大模型的弱项

不过上个月才出的讯飞星火意外地表现有些惊喜。

讯飞星火首发后，知名科技行业观察者《差评》，就曾对讯飞星火作出过全面测评，在数学测验部分，也展示了讯飞星火基础的数学能力，全部答对毫无压力。

国产大模型讯飞星火的崛起：重塑未来的竞争力

经典的鸡兔同笼问题，即使变换参数和问法也能全部答对。

国产大模型讯飞星火的崛起：重塑未来的竞争力

用《差评》文中的话来说，讯飞星火做数学题，有一种过于强大，可以和GPT4掰掰手腕的感觉。

这种感觉，将国产大模型的回答都放一起后则更加强烈。

《科创板日报》就曾在一篇文章中，对文心一言、科大讯飞、360智脑几家比较有代表性的大模型进行测评展示。

例如，“某次数学竞赛共20道题，评分标准是：每做对一题得5分，每做错或不做一题扣1分。小华参加了这次竞赛，得了64分。问：小华做对几道题？”

正确答案应该是14题，我们看一下各家大模型的作答。

文心一言：

国产大模型讯飞星火的崛起：重塑未来的竞争力

360智脑：

国产大模型讯飞星火的崛起：重塑未来的竞争力

讯飞星火：

国产大模型讯飞星火的崛起：重塑未来的竞争力

可以看到只有讯飞星火答对了，文中展示的另一道小升初数学题，同样也只有讯飞星火答对。

《科创板日版》在文章开头也指出，科大讯飞星火认知在数理能力表现尤为突出。

那到底能突出到什么程度呢？

我们继续对讯飞星火加大难度看看。

国产大模型讯飞星火的崛起：重塑未来的竞争力

大模型在数学领域的表现有着见微知著的效果，因为这需要结合大语言模型和计算引擎两者的能力。在复杂逻辑条件下，学习多步骤推理，这对计算资源和数据，有着海量需求，对算力也有着极高的要求。

讯飞星火在数学方面能力的展示，更是一家企业数据资源和算力水平的展示。对于国产大模型来说，数学能力是意义非常的。

不过，大模型不是一朝一夕就能训练完成的，如何落地？能不能落地？也是企业需要考虑的。

落地前景

大模型的出现注定是要破旧立新的，技术的发展回归到现实生活中，还是要看它的实际应用能力。

《娱乐资本论》做过一期市面上主流的5款大模型，一共90个回答的横评，想必耗费了不少时间精力，整体评价也是比较中肯的，颇具参考意义。

可以先看一下这张最终测试评分表。

国产大模型讯飞星火的崛起：重塑未来的竞争力

大模型这种属于比较底层的框架，我们势必要做出自己的由中文语料训练而成的大模型。所以我们不可避免地会与ChatGPT相比较。

从上图来看，目前在落地应用方面，讯飞星火在主流国产大模型中，离ChatGPT是最近的。

具体到案例中，我们截取小红书带货的商业文案来看一下。

文案较长，内容有所折叠，不过总的来说，文中展示的两个作答还是比较贴切的。

星火自设了一款手机型号进行更准确的数据呈现，内容和逻辑这种长处不作过多分析，主要拉开差距的地方还是要求中的emoji表情。

相较于文心一言和天工未能察觉出需要在文案和题中带有emoji表情，星火的emoji甚至还有关联性，直接拿去发小红书基本也足够了。

《TMT时报》的记者也对文心一言、通义千问、讯飞星火的商业文案能力做过测试。

文心一言：

通义千问：

讯飞星火：

文心一言虽然洋洋洒洒写了不少，不过作为海报文案还需再精简一番；通义千问整体表现不错，不过相对更侧重中秋，而失了商业主体的主导作用；讯飞星火完成度依旧出色，也更突出所设定的AI医疗公司的保护健康的作用，是可以直接拿来使用的程度。

其实讯飞星火在落地应用方面，还做出了不小的尝试。

讯飞星火升级到V1.5版本后，新增了星火助手功能，人手一个贾维斯不再是幻想。

目前经审核上传的星火助手多达500多个，遍及各个行业和细分领域，还支持自己创建，并不断调试出符合自己需求的专属小助理。

除了我们比较能想象到的日常办公，笔者对其中的脑暴部分更加感兴趣，比如这个“小说灵感记录员”。

从动物社会结构，到智慧与力量的平衡，再到文化传承等等，这对创作类相关行业的增益可想而知。

星火助手发布时间还并不长，整体来看，仍有不少需要调试改进的地方。

不过，随着时间的推移，星火助手在落地能力以及前景等方面已经展示出了相当的潜力。

尾声

中国科学技术信息研究所发布的一份报告显示，从全球已经发布的大模型分布来看，在大模型数量上，中国和美国超过全球总数的80%，中国从2020年进入大模型快速发展期，目前与美国保持同步增长态势。

除了大模型，应用端也呈现出爆发式增长的态势。

中国经营报在3月的一篇文中提到，天眼查数据显示，截至当时，人工智能相关企业258.8万余家，其中，2022年新增注册企业73.2万余家，新增注册企业增速41.5%；近三年（2020～2022年）人工智能相关企业新增注册企业增速均超过40%。

大模型以及大模型相关的企业，正在如雨后春笋般涌现。

时代的机遇下，作为国产大模型的重要代表之一，讯飞星火也已经隐隐有了燎原之势。

（来自韭研公社APP）（来自韭研公社APP）返回搜狐，查看更多

责任编辑：

重塑未来, 讯飞星火, 大模型, AI提示工程师

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

# 讯飞星火 # # 医疗 # 教育 # AIGC # ChatGPT # GPT4 # 互联网 # 医疗 # 天工 # 情感 # 教育 # 文心一言 # 星火 # 机遇 # 行业 # 通义千问 # 销售

文章版权归作者所有，未经允许请勿转载。

揭秘卧龙地产：参股公司君海网络如何打造3个爆款IP并拥抱AI革新?

lida

168

红包测试：女性朋友的反应

lida

192

揭秘数字营销力：实操案例解析，让你火速提升！？

lida

145

ChatGPT热或在降温，但一个重要的新行业正在形成参考消息2023-09-29 16:59参考消息2023-09-29 16:59

lida

161

ChatGPT下架官方检测工具，承认AI文字无法鉴别

lida

149

通义千问来袭，阿里云大模型开始测试，生成式AI市场风云变局，未来已来？

lida

185

No comments

No comments...

国产大模型讯飞星火的崛起：重塑未来的竞争力

讯飞智能升级，AI办公本语篇规整，你的高效助手已来！

《讯飞星火认知大模型：通用人工智能的曙光》

Related posts

No comments