文章主题:人工智能, 认知大模型, 讯飞星火, 自然语言处理
自从ChatGPT的热度逐渐上升,全球范围内人工智能领域又迎来了一股新的浪潮。与此同时,围绕认知大模型的类似ChatGPT的技术也正在持续发展并崭露头角。
在今天这个阳光明媚的午后,科大讯飞举办了一场盛大的讯飞星火认知大模型成果发布会,向世人展示了他们在教育、办公以及车载等领域所取得了令人瞩目的成果。
讯飞星火,这款类似于ChatGPT的认知大模型产品,在大规模知识库、自然语言处理、个性化学习、多模态交互和可定制性等多个方面展现出了其独特的优势。在产品的正式发布之际,我们有幸进行了实际测试与体验,对其对话交流能力进行了深度评估。现在,让我们来一探究竟,看看讯飞星火是否真的具备足够的智慧。
讯飞星火实测,理解能力出色,可用性较高
在评估过程中,我们IT之家从四个核心能力对讯飞星火进行了详尽的实际测试,这包括内容生成能力、逻辑理解能力、专业知识能力以及解决生僻问题的能力。
在内容创作与生成方面,IT之家选用讯飞星火作为合作伙伴,邀请其撰写一篇关于鲁迅《孔乙己》的课文。令人惊喜的是,讯飞星火成功地完成了这篇课文的创作,展现了卓越的写作实力。
在编程领域中,质数是一个重要的概念。本次实践中,我们以“提取 0 到 100 中所有质数”为主题,邀请讯飞星火撰写一段相关代码。该程序迅速提供了 Python 语言的算法代码,并在下方进行了详细解释。此外,为了帮助读者更好地理解算法的实现过程,还提供了简单的思路阐述,这无疑增强了本文的专业性和实用性。
接着小编直接说“换成用 C++ 语言来写”,它又很快给出了用 C++ 语言实现的代码,非常方便。
在逻辑理解能力方面,我们首先选取了一个具有代表性的经典过河问题向讯飞星火提出挑战。这道题目的确切含义可能较为复杂,但讯飞星火却能迅速领悟题目要义,并进而将过河的过程逐步拆解,条理清晰。
逻辑能力无疑是最基本的能力之一,但是如果想要在语言理解和表达方面也表现出色,就需要付出更多的努力。为此,我们的小编进行了另一项测试,这次是针对一些绕口令一样的语句,这些语句中包含了许多不同的“意思”。然而,令人惊喜的是,讯飞星火成功地准确理解了每一个“意思”所代表的含义,这足以证明其在语言理解方面的强大能力。
专业知识能力上,小编首先让它帮我解释一下量子计算,可以看到它能够以相对简明的方式将量子计算的概念给解释出来。
接着小编又问了一个进阶一些的问题,讯飞星火给出了一段不明觉厉的思考过程,不过最终输出的答案是 2000 焦耳,正确的答案小编查到应该是 1000 焦耳。
在生僻问题测试中,小编首先问了一个《王者荣耀》游戏中鲁班这个英雄的特点是什么,讯飞星火很准确地回答了出来。
接着小编又问“《荒野大镖客:救赎 2》中亚瑟・摩根是哪个帮派的?”这次的回答中,讯飞星火基本意思回答正确了,但是“Van der Linde”翻译应该是“范德林得”帮,讯飞星火答成了让人一脸懵的“圣胡安帮”。
整体体验下来,小编的感受是,讯飞星火对于中文语言语义的理解和逻辑思维的理解能力上目前是非常出色的,测试时给他在语言或逻辑上设的“坑”,大部分都能成功避开,这个理解能力相较于国内其他一些认知大模型产品还是比较有优势的。
并且讯飞星火对于生成结果的语音朗读功能是个加分项,这让我们看到它在更多终端、场景上应用的前景。
当然,当前内测阶段,讯飞星火也表现出了不足,主要是知识库的储备和语料库的更新速度上,还有可以进步的空间,一些稍专业或偏门的问题,讯飞星火也会给出错误的回答。当然,这些不足,是可以随着知识库、语料库的丰富而得到解决的。
数十年技术积淀,讯飞在认知大模型上的“天然优势”
根据发布会上科大讯飞董事长刘庆峰的介绍,讯飞是在去年 12 月开始启动认知智能大模型的专项公关,而在短短 5 个月左右的时间里,讯飞星火就能呈现出目前这样基本成熟,让人倍感惊艳的产品形态,这背后,其实还是要得益于科大讯飞在大模型源头核心技术上超过十年的储备和沉淀。
2011 年,科大讯飞就承建了语音及语言信息处理国家工程实验室,并提出“让机器像人一样能听会说”的理念。要知道,认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是一个基础条件。
2014 年科大讯飞推出“讯飞超脑计划”,明确提出:让机器像人一样能理解会思考。2022 年这一计划又升级为“讯飞超脑 2030 计划”。
还有在 2017 年,科大讯飞承建认知智能国家重点实验室。也就是从这一年起,科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了 96.3% 参加考试的医生,并且在 SQuAD 机器阅读理解中全球首次超过人类平均水平。
刚刚过去的 2022 年在 OpenBookQA 科学知识推理中,单模型也超过人类平均水平。
正是因为有这样的技术积淀,我们看到这次讯飞星火认知大模型表现出的让人惊讶的语言、语音理解能力和逻辑思维能力。特别是对于中文用户来说,这一点很重要,因为类似 ChatGPT 等这样的大模型并没有对中文语境的习惯和特点做针对性的训练,因此往往会出现一些让人啼笑皆非的答案。
而不夸张的说,AI 语音、语言理解是科大讯飞的传统强项,像 ChatGPT 这样的认知大模型,对于讯飞来说是存在天然优势的。
通用型人工智能,首先得用起来
过去,人工智能技术虽然也比较火热,但论应用,更多还是在专业领域,而 ChatGPT 带动认知大模型的火热,让 AI 真正从“专用”迈向了“通用”,这无疑是 AI 发展的一个重要里程碑。
当然,无论是专用,还是通用,前提得是“用”起来,才能真正发挥 AI 技术对社会生活带来的变革能力。相较于其他认知大模型,讯飞星火显然是提前一步将“应用”纳入了规划范畴。
星火认知大模型从最初的开启立项,其就是基于“1+N”架构来建设的,其中“N”就表示多个领域的内容,也就是应用。在发布会上,讯飞就公布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。
比如说在教育领域,大模型就在和讯飞 AI 学习机结合,让 AI 学习机 T20 系列可实现中英文作文类人批改,这个批改过程是实时的,层层点评,高效精准,更可实现写作思路启发,利用 AI 润色技术生成片段优化参考和写作建议提升。
比如在办公领域,大模型也在和讯飞智能办公本结合,可以根据手写要点自动生成会议纪要,助力办公效能进一步提升。
在汽车领域,大模型则可以和智能座舱结合。目前科大讯飞已为数千个车型提供业界领先的智能语音交互服务,而与讯飞星火认知大模型结合后,这种人机交互再上一个新的台阶,实现更自由、更拟人化地沟通,让汽车驾驶更智能、更安全、更有乐趣……
除了这些具体领域的应用,科大讯飞还为讯飞开放平台新增了星火认知大模型,已经开放了 560 项 AI 能力,并聚集了超过 500 万生态合作伙伴,相信在它的加持下,讯飞星火认知大模型会不断完善,持续应用在社会的各行各业,让 AI 不仅是极客炫技的工具,而是踏踏实实能帮助人们生活工作的工具。
如果在讯飞星火上问它“你为什么叫‘星火’”,它首先就会告诉你,星火,来源于“星星之火,可以燎原”。这是科大讯飞对 AI 技术和业务的目标,也是他们对 AI 产业发展的信念。
而讯飞星火,对于科大讯飞来说,也许就是星火燎原过程中,第一团燃烧成势的火焰。
也期待它成为将我们的 AI 理想照进现实的那团火焰。
人工智能, 认知大模型, 讯飞星火, 自然语言处理
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!