文章主题:讯飞星火, 大语言模型, 内测, AI
国内又一个类ChatGPT大语言模型开始内测了,它就是“讯飞星火“。
讯飞,一家历史悠久的科技企业,其初印象源于其出色的语音技术。然而,随着科技的不断进步,这家公司也紧跟时代潮流,向人工智能领域发起了进攻。令人惊讶的是,讯飞的大语言模型的发展速度之快,让人不禁感叹其强大的创新能力。
在申请过程中,我注意到自己的申请结果出人意料地顺利,这让我感到有些意外。因此,我认为在标题上强调我的“给力”非常必要。尽管百度在我提交申请后的一个月内仍未给予回应,但阿里云却对我的申请置之不理。
在申请过程中,我首先打开了网站的首页,接着点击了“需求调研”按钮。在填写信息时,我分别设置了姓名、联系电话以及公司职位,同时还有一个用于标注用途的文本框。在完成所有必要的填写后,我立即提交了申请。不久之后,我便收到了来自AI的电话邀请,对方仅询问了两项问题,便迅速为我解决了疑虑。
申请通过后,“需求调研”按钮就变成了“加入体验” ,点击后会显示一个体验规则。
点一下同意体验,立马就进入对话页面了。这个效率真的是高。从想用到用上只用了几分钟时间。
进来之后,界面很简单。基本和其他平台差不多了,左边是会话记录,右边是对话窗口。
在新的对话中,我们会提供一系列的问题样例,涵盖了旅游规划、减肥计划、烹饪技巧、数学计算以及语文中的近义词等多个领域。这些都是我们在日常生活中经常需要涉及到的主题,相信您一定对这些话题有所了解。作为人工智能助手,我们一直秉承着开放、全面的原则,为您提供最优质的服务。至于其他方面的内容,如果您有其他的需求或者想要测试我们的能力,我们也非常欢迎,但是请您提前告知我们需要面对的主题,以便我们更好地为您服务。
大概说下结论,基本问题,表现正常。
我还是直接问我常问的:爸爸和妈妈是什么关系,他们可以结婚吗?
哈哈哈…一招K·O!答案基本和GPT3.5,还有claude差不多了。
然后考验一下它的角色扮演能力。
哈哈,这个小朋友不好教,不管你说什么,他都是很直白地告诉你,他是科大讯飞的智能大模型。
在接下来的步骤中,我决定对我的编程技能进行一次测试,以期能够更好地了解自己的能力水平。经过一番尝试,我发现我的编程能力相当不错,至少在所提供的材料中,它们的清晰度非常高。这些材料详细地列出了HTML、CSS、JavaScript以及Python代码,使我能够在短时间内快速掌握并应用它们。
生成内容的质量相当出色,从生成的HTML页面中可以看出,我们已经成功引入了style.css和script.js文件,同时还加入了JQuery和Bootstrap等JavaScript库。这一切都显示出我们在技术方面的卓越实力。
后端也是按要求用Python给我写好了,使用了flask,并且给了很多解释性的文字。
从完成度上来说,要比之前测试的谷歌bard要好不少啊。
在对GPT4进行了一系列基础的测试之后,我突然萌生了一个念头,那就是让它出一些大语言模型的测试题目。没想到的是,GPT4对我的请求非常响应,立刻就提供了相关题目。从这些题目的质量来看,GPT4确实是一个技术实力强大的工具。
这个太专业,我都不知道怎么去评测,就让他写具体一些。
他给了几个方向测评方向,给了题目,要求,和评判标准。我还是觉得有点抽象。就像他直接给我出题目。
我根据GPT4出的题目测了一下讯飞星火,基本上都回答的不错。
常识题,没有任何问题。情感倾向分析也基本到位。
太常规测不出水平分界线,然后我就让GPT4出一些陷阱题。
GPT-4堪称出题高手,它擅长捕捉心理暗示的线索,例如鸟类在水中的呼吸机制。这一问题成功地令讯飞星火陷入困惑。
讯飞星火的答案:
说实话,我觉得这个答案好像也挺专业的,已经完全超出我的知识储备。他首先说了有些鸟类能在水里呼吸… 然后还说肺部有特殊结构,还举例说明,真的好真的感觉… 但是GPT4字多,我信GPT4,哈哈~~
GPT4给的参考答案:
看大语言模型过招,我就像一个小白。哪天它们反过来测试我的时候,我估计及格线都到不了。
我都是想到哪里测到哪里。
这篇文章主要表达一点:我用上了,你们赶紧。
讯飞星火, 大语言模型, 内测, AI
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!