文章主题:讯飞星火认知大模型, 内测, 跨领域知识, 语言理解
4月24日,科大讯飞在其官方社交媒体平台上推出了讯飞星火认知大模型,但至我国时间为止,其详细信息尚未被官方公布。尽管如此,我们幸运地获得了内测资格,并在大量测试中对其进行了深入研究。据我们的了解,该认知大模型将于5月6日正式亮相,让我们共同期待它带来惊艳的表现。
在深入了解科大讯飞的产品后,我们可以发现,其讯飞星火认知大模型依托于大量文本、代码以及知识的积累,具备了跨足多个领域的知识体系和强大的语言理解能力。该模型能基于自然的对话模式来理解和执行各种任务,只需要一个指令,就能明白你的需求,给出恰当的回应,甚至还能主动创造你需要的内容。因此,讯飞星火认知大模型无疑是一个极其贴心的“智能助手”。
具体体验如何,我们来亲自体验一下吧。
以下是部分测试的截图:
首先,提出简单的问题:可以做一下自我介绍吗?
在首次操作中,内容的快速生成还是出乎意料的。
一、创作能力
对于文字工作者而言,最重要的是不断提升自身的创作能力和获取数据的实时性。下面,让我们通过一篇关于奇幻小说《长月烬明》的影评,来探讨其写作技巧。
在观察讯飞星火认知大模型的回复时,我们可以发现它仅仅是在套用一种格式化的模板,而在对主要角色的描述上出现了偏差。因此,当我们点击“重新生成”按钮时,我们的期望是讯飞星火认知大模型能够再次给出回答,以便我们对其结果进行评估,看是否达到我们的预期。
从结果来看,仍然不尽如人意。先抛开剧情的套话描述,其演员团队依旧是错误的。
再来一个问题:以“讯飞星火”做一首藏头诗.
在分析前两次生成的内容之后,我们可以得出一个初步结论:讯飞星火认知大模型的性能具有一定的潜力,然而其完善程度仍有待提高,目前大约仅有50%的完成度。
对外的内容出现偏差,可以理解,那对内呢?来问一下,科大讯飞2022年的营收情况。
这则回复出人意料地出现在4月20日晚,当时科大讯飞已经公布了其财报,而非将此事件安排在未来某个时间点。此外,作为一款基于语言模型的AI产品——讯飞星火认知大模型,它并未生成过模板化的内容,这也让人颇感意外。
二、逻辑能力
把两杯50度的水融在一起后,水的温度是多少?
1+1在什么情况下等于3?
如果猫会爬树,那么狗也会。
针对逻辑性问题,笔者也尝试了重新生成,来看看有没有不同的答案,但多次生成的回复是一样的。
三、编程能力
先来一个简单的编程问题“从1加到100等于多少,请用JAVA语言编程,并得出结论。”
“编写一个JAVA程序,用if-else语言判断2023年是否为闰年。”
对于该开发者的编程技能,我向两位Java工程师咨询了意见,他们一致认为该开发者在编程领域具有一定的实力。然而,在大型项目的实际编程表现方面,能否达到预期效果,还需观察其能否提供详尽的描述。
四、图文生成能力
前有百度文心一言,后有通义千问等等大模型。图文生成能力也是备受关注的一点。
可以看到,讯飞星火认知大模型定位于语言模型目前无法生成图片。
五、交互能力
成语接龙是最直接的交互形式,来玩一局。
对于出现“及时雨”回复时,多次让其重新生成,答案内容并未改变。
总体而言,科大讯飞所发布的讯飞星火认知大模型在某些方面仍处于起步阶段。在语义理解、持续对话、编程技能以及数理逻辑推理等方面,其与真正实现“对话式AI”的目标还存在一定的差距。
最后再来一个问题,“目前有几个和你类似的认知智能模型?”
通过回复可以看到,当前类似的认知智能模型已经有很多了,讯飞星火认知大模型的将呈现怎样独有的优势呢?还需要再等十余天才能揭晓。
本文源自iDoNews
讯飞星火认知大模型, 内测, 跨领域知识, 语言理解
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!