文章主题:大模型, 想象力, 情感, 思辨性
互联网曾经近乎重写了所有行业,通讯、购物、支付、打车、点餐等等,人们生活的方方面面几乎被重塑。
如今大模型再次给予人们充分的想象空间。
原内容提到了ChatGPT在取代一些重复性和规律性较高的工作方面具有潜力,同时也能释放更多生产力,引导人们更加关注具有想象力、情感和思辨性的领域。这一趋势有望催生诸如AI提示工程师、AI调教师和AI创意师等一系列新兴职业。基于此,我们可以认为ChatGPT的广泛应用将对传统职业产生深刻影响,并催生出一系列新兴职业,从而推动AI技术的发展和应用。
大模型可以被视作一个全新的系统,具有广泛的应用潜力。这个系统能够降低许多行业的门槛,使得更多的产品得以构建,同时也为人们提供了更多创造性的劳动机会。随着技术的不断发展,我们可以预见在未来会有越来越多的行业需要利用大模型的能力,从而推动社会的进步和发展。
在我国科技信息研究所的不完全统计数据中,目前我国已经推出了超过70个大模型,其中许多产品的表现都相当出色,展示出了令人瞩目的实力。
以科大讯飞为例,其在基于讯飞星火认知大模型研发的学习机和办公本等产品助力下,今年再次刷新增长速度,618期间的销售额同比增长达到了125%,同时在不同品类中也成功地夺得了销售冠军的荣誉。
在资本市场上,同样的现象也得到了体现。在 6 月 20 日这一天,AI 概念股的表现格外抢眼,其中科大讯飞的涨幅接近 7%,使其复权股价創下了歷史新高水平。科大的成交額达到了 102 億元,在兩市中獨占鳌頭。
作为一名文章写作高手,我将按照您的要求对原文进行改写。在本文中,我将分享我如何利用讯飞星火大模型进行各种有趣测试,并探讨当前AI大模型的发展状况。首先,我很高兴地发现自己 now 可以运用讯飞星火大模型了。近期,我有幸见证了诸多令人好奇的实验。为了让大家对AI大模型的最新进展有更深入的了解,我们将一同探讨现有技术的实际应用与潜在可能性。通过亲身体验,我发现讯飞星火大模型确实具有很高的实用价值。它的出现不仅推动了AI技术的发展,还为各行各业带来了前所未有的便利。如今,AI已经渗透到我们生活的方方面面,从智能家居、自动驾驶到医疗健康等领域,都取得了显著的成果。当然,作为一个新兴领域,AI仍然有许多挑战需要克服。比如,如何在保护用户隐私的同时,充分利用海量数据进行高效分析?又如何确保AI系统的公平性和可持续性,避免因技术偏见而导致的歧视和不公?面对这些挑战,我们需要不断探索和创新,推动AI技术的健康发展。总之,随着AI大模型的不断进步,我们有理由相信,未来将会有更多神奇的技术和应用涌现。让我们共同期待AI领域的新突破,并持续关注这一领域的最新发展动态。
1、错别字识别哪家强
高考作文想必大家都看腻了,前阵子看到《智商税研究中心》的这篇校对测评的设问还挺特别。
篇幅有限,拎出几个比较能拉开差距的问题,来跟大家一起分享看看。
首先是字词方面。
如果洛阳的亲朋好友向您询问我的近况,您可以告诉他们我正在岳阳楼度过美好的时光。这个回答旨在考验人工智能助手的基本功,尤其是拼写和理解能力。
讯飞星火:
文心一言:通义千问:360 智脑:GPT4:讯飞星火、文心一言、通义千问、GPT4 都顺利完成基础的校对,只有 360 智脑,追问之下仍表示无误。
再来看语病方面。
在众多语病校验示例中,AI的表现不尽如人意,但令人欣慰的是,通过AI直接识别判断是否存在歧义,我们仍能观察到我国国产AI大型模型间的性能差异。
例如,” 这句话有歧义吗:在床上‘葛优瘫’了一天,他突然想起来了。”
讯飞星火:
文心一言:通义千问:360 智脑:GPT4:这里虽然几乎全军覆没,不过讯飞星火还是指出了 ” 可能存在一些解读上的歧义 “,一直表现不错的 GPT4 没能看出歧义还是有点意外。
最后看下指正校对错误后,AI 大模型能否承认错误接受指正。
讯飞星火:
文心一言:通义千问:360 智脑:GPT4:这部分讯飞星火意外地跟 GPT4 表现得旗鼓相当,反应迅速,简洁明了,承认错误后直接给出了校对后的句子;文心一言还要再进一步给出指令才会给出答案;而通义千问和 360 智脑则是 ” 积极认错,坚决不改 “。
校对文本错误在某种层面上,反映了大模型的基础能力,地基打好了,才能有更多上探的空间。
总体来说,在基础的校对能力上,讯飞星火算是国产大模型中最接近 GPT4 水平的;其他表现也中规中矩;至于 360 智脑,用 360 掌门人周鸿祎在 360 首发时的话来说,360 智脑还只是个 ” 孩子 “,距离完善使用还有相当的一段路要走。
2、” 数学高手 “
寒窗苦读十余年,无论教育制度怎么改,除了语文,还有一个怎么也躲不掉的,就是数学。
数学的重要性不言而喻,它培养了我们的逻辑思维能力。但相对于大模型擅长的文本内容,数学能力在一定程度上算是大模型的弱项
不过上个月才出的讯飞星火意外地表现有些惊喜。
讯飞星火首发后,知名科技行业观察者《差评》,就曾对讯飞星火作出过全面测评,在数学测验部分,也展示了讯飞星火基础的数学能力,全部答对毫无压力。
经典的鸡兔同笼问题,即使变换参数和问法也能全部答对。用《差评》文中的话来说,讯飞星火做数学题,有一种过于强大,可以和 GPT4 掰掰手腕的感觉。
这种感觉,将国产大模型的回答都放一起后则更加强烈。
《科创板日报》就曾在一篇文章中,对文心一言、科大讯飞、360 智脑几家比较有代表性的大模型进行测评展示。
例如,” 某次数学竞赛共 20 道题,评分标准是:每做对一题得 5 分,每做错或不做一题扣 1 分。小华参加了这次竞赛,得了 64 分。问:小华做对几道题?”
正确答案应该是 14 题,我们看一下各家大模型的作答。
文心一言:
360 智脑:讯飞星火:可以看到只有讯飞星火答对了,文中展示的另一道小升初数学题,同样也只有讯飞星火答对。
《科创板日版》在文章开头也指出,科大讯飞星火认知在数理能力表现尤为突出。
那到底能突出到什么程度呢?
我们继续对讯飞星火加大难度看看。
大模型在数学领域的表现有着见微知著的效果,因为这需要结合大语言模型和计算引擎两者的能力。在复杂逻辑条件下,学习多步骤推理,这对计算资源和数据,有着海量需求,对算力也有着极高的要求。
讯飞星火在数学方面能力的展示,更是一家企业数据资源和算力水平的展示。对于国产大模型来说,数学能力是意义非常的。
不过,大模型不是一朝一夕就能训练完成的,如何落地?能不能落地?也是企业需要考虑的。
3、落地前景
大模型的出现注定是要破旧立新的,技术的发展回归到现实生活中,还是要看它的实际应用能力。
《娱乐资本论》做过一期市面上主流的 5 款大模型,一共 90 个回答的横评,想必耗费了不少时间精力,整体评价也是比较中肯的,颇具参考意义。
可以先看一下这张最终测试评分表。
大模型这种属于比较底层的框架,我们势必要做出自己的由中文语料训练而成的大模型。所以我们不可避免地会与 ChatGPT 相比较。
从上图来看,目前在落地应用方面,讯飞星火在主流国产大模型中,离 ChatGPT 是最近的。
具体到案例中,我们截取小红书带货的商业文案来看一下。
文案较长,内容有所折叠,不过总的来说,文中展示的两个作答还是比较贴切的。
星火自设了一款手机型号进行更准确的数据呈现,内容和逻辑这种长处不作过多分析,主要拉开差距的地方还是要求中的 emoji 表情。
相较于文心一言和天工未能察觉出需要在文案和题中带有 emoji 表情,星火的 emoji 甚至还有关联性,直接拿去发小红书基本也足够了。
《TMT 时报》的记者也对文心一言、通义千问、讯飞星火的商业文案能力做过测试。
文心一言:
通义千问:讯飞星火:文心一言虽然洋洋洒洒写了不少,不过作为海报文案还需再精简一番;通义千问整体表现不错,不过相对更侧重中秋,而失了商业主体的主导作用;讯飞星火完成度依旧出色,也更突出所设定的 AI 医疗公司的保护健康的作用,是可以直接拿来使用的程度。
其实讯飞星火在落地应用方面,还做出了不小的尝试。
讯飞星火升级到 V1.5 版本后,新增了星火助手功能,人手一个贾维斯不再是幻想。
目前经审核上传的星火助手多达 500 多个,遍及各个行业和细分领域,还支持自己创建,并不断调试出符合自己需求的专属小助理。
除了我们比较能想象到的日常办公,笔者对其中的脑暴部分更加感兴趣,比如这个 ” 小说灵感记录员 “。从动物社会结构,到智慧与力量的平衡,再到文化传承等等,这对创作类相关行业的增益可想而知。
星火助手发布时间还并不长,整体来看,仍有不少需要调试改进的地方。
不过,随着时间的推移,星火助手在落地能力以及前景等方面已经展示出了相当的潜力。
4、尾声
中国科学技术信息研究所发布的一份报告显示,从全球已经发布的大模型分布来看,在大模型数量上,中国和美国超过全球总数的 80%,中国从 2020 年进入大模型快速发展期,目前与美国保持同步增长态势。
除了大模型,应用端也呈现出爆发式增长的态势。
中国经营报在 3 月的一篇文中提到,天眼查数据显示,截至当时,人工智能相关企业 258.8 万余家,其中,2022 年新增注册企业 73.2 万余家,新增注册企业增速 41.5%;近三年(2020~2022 年)人工智能相关企业新增注册企业增速均超过 40%。
大模型以及大模型相关的企业,正在如雨后春笋般涌现。
时代的机遇下,作为国产大模型的重要代表之一,讯飞星火也已经隐隐有了燎原之势。
– END –
如对本稿件有异议或投诉,请联系 931394256@qq.com
大模型, 想象力, 情感, 思辨性
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!