ChatGPT的走红后,国内人工智能大模型东风已起,技术与产业变革的浪潮正涌。
国内首批亮相的AI大模型“文心一言”和“星火大模型”,让”百度“和”讯飞“成为这场AI浪潮里面的弄潮儿。
上个月,百度发布国内首个对标“chatgpt”的大模型”文心一言”,效果有些不尽人意,被网友戏称为“chatPPT”。
所谓期望越大,失望就越大,不期待就不会落泪。
所以,本月月初正式发布的讯飞星火认知大模型也少有人关注。但值得一提的是,讯飞星火并不是“PPT发布”,发布会现场演示了星火认知大模型的多种能力,而且目前也已经大规模开放体验。
但有网友体验过后吐槽称生成结果太「离谱」,甚至还有人说是它是「套壳」OpenAI的ChatGPT!
01又陷套壳风波?
“套壳”只会迟到,不会缺席。
继“文心一言”陷入套壳风波之后,网友们对待国内大模型是否是套壳一事,仿佛秉承“宁可错杀一百,不可放过一个”的初衷,管你什么呢,我先怀疑了再说。
毫无疑问“讯飞星火”也逃不过“套壳”风波。不过,讯飞第一时间给出了回应:网上有谣言说讯飞星火大模型“套壳 OpenAI 的 ChatGPT”既不符合事实,也不符合逻辑:如果是套壳ChatGPT,就不可能出现讯飞星火大模型的响应速度比ChatGPT还快;更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于ChatGPT的情况。”
显然,网友们并不买账,甚至还小小的讽刺了一波。
“如果真是套壳,也不至于这么一言难尽”“不开源,一片安静,一开源,遥遥领先”
你以为这就完了,就在上周三,科大讯飞股价午后意外大幅下跌,出现重大风险的消息又冲到了微博热搜榜单。
据悉,有人利用文心一言写做了一篇“科大讯飞出现重大风险的警示文”,文内称,科大讯飞被曝涉嫌大量采集用户隐私数据,并将其用于人工智能研究。
科大讯飞也相继给出回应:“股价下跌系某生成式AI写作虚假小作文导致,谣传风险为不实消息。”
看到这里,我只想说“套不套壳的,大家懂的都懂 ”,不过,看AI掐架还是第一次。02
星火大模型,领跑国内了?
看到这个消息,是不是愣了一下,我知道你很惊讶,但是你先别惊讶。
5月9日,中文通用大模型综合性评测基准 SuperCLUE公布了首个测评榜单,其中上周刚发布的讯飞星火认知大模型拿下国内第一。
(SuperCLUE测评维度)
据了解,SuperCLUE测试基准主要从基础能力、专业能力以及中文特性三个方面进行能力测试,其中包括语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等 10 项常见的代表性基础能力;涵盖了从数学、物理、地理到社会科学等 50 多项专业能力;以及中文成语、诗歌、文学、字形等 10 项中文特点能力。
我们先不管这个测试和榜单靠不靠谱,毕竟“一千个人心中就有一千个哈姆莱特”,压不住好奇心就主动测试一波。
先来几道经典的“语义大考验”
“雨天骑自行车,车轮打滑,还好我反应快,一把把把把住了。”
“我大舅去二舅家找三舅说四舅被五舅骗去六舅家偷七舅放在八舅柜子里面的1000元。究竟谁是小偷?谁被偷?”
科大讯飞星火大模型在数学上表现也很不错,在测试中,鸡兔同笼问题、三元一次方程、平面几何、解三角形、数列、不等式均不在话下。
一轮测试下来,讯飞星火的表现“超出预期”,甚至还有点“聪明”,语义理解准、回应迅速、数学题、生活常识问题全都能轻松应付,不得不说,讯飞星火在数学题和回应速度上面是有点东西的。
科大讯飞的星火大模型在命名上取义于“星星之火 可以燎原”的含义,但讯飞是否真的能以“星火燎原”之势领跑国内大模型,现在还未可知,毕竟还有许多国内科技巨头还在大模型的考场里面“奋笔疾书”,期待一下讯飞6月9日的新版本吧。
03上来就说超越,那叫吹牛
毕加索说“模仿是人类一切学习的开始,然后才是创新,最后是你自己做主。好的艺术家模仿皮毛,伟大的艺术家窃取灵魂。”
在大模型这件事上,国外chat-gpt领跑,不得不承认差距是有的,大模型的研究始于对现有技术的模仿和借鉴也是不可否认的。
周鸿祎谈到对ChatGPT的看法时说:“我自己觉得GPT的技术,今天肯定是模仿,肯定是抄袭,这个毫不讳言。就像电动车,最早大家都抄特斯拉,但做着做着,你对这东西就会越来越了解。而且随着你的市场化、场景化的扩展,用户的扩展,在未来有可能弯道超车或者后来居上。但是说你不经过这两年的一种模仿和抄袭,你上来就说我们就能超越,那才叫吹牛呢。
“超越”才是每一个创作者所毕生追求的,艺术是这样,产品创作亦是如此。
不久的将来,大模型遍地开花只会是必然,现下不仅百度、腾讯、阿里、华为、京东等科技巨头入局部署,众多科创企业也纷纷入局,在这场由ChatGPT引发的AI混战中,我们需要思考的是单纯的模仿并不能带来真正的创新,没有创新谈何“超越”,届时“套壳”风波只会反复重现。