文章主题:讯飞星火大模型, V3.0, 代码能力, 主动式交互
在10月24日的1024全球开发者节上,科大讯飞如约推出了讯飞星火大模型V3.0。科大讯飞董事长刘庆峰表示,讯飞星火3.0在七大能力上不断升级,其表现已经超越了ChatGPT,特别是在医疗领域更是超过了GPT-4。
讯飞星火是一款独特的国产大模型产品,尽管并非最早亮相,但其却是最早提出明确升级节点并精细到日期的。自2023年5月6日推出星火V1.0版本以来,该产品在短短5个月内成功超越了ChatGPT,展现出了强大的实力和不断进化的决心。在10月24日,星火V3.0如约更新,再次证明了其在人工智能领域的领导地位。
在一篇由国务院发展研究中心国研经济研究院撰写的报告中,他们运用了星火V3.0以及其他大型语言模型产品进行了对比评估。该报告指出,星火大模型的综合能力已经超过了ChatGPT,在国内市场处于领先地位,具备国际级的竞争力。
星火 V3.0 这么厉害?
话不多说,是骡子是马拉出来溜溜,今天我们就来上手实测下讯飞星火 V3.0 的能力如何。
在科大讯飞的最新发布会上,重点展示了讯飞星火V3.0在代码能力方面的显著进步。根据刘庆峰的观察,随着产业数字化和数字产业化的深入推进,软件已经成为了定义未来的力量。在这个被视为数字世界基石的领域,讯飞星火V3.0的代码能力得到了进一步提升。在“智慧课堂”产品的跨平台升级过程中,涉及从Windows平台向Linux平台的重大转变,其代码数量高达20万。按照传统的开发流程,这样的迁移任务至少需要三个月的时间。然而,借助于星火赋能的力量,这一过程仅用了短短一个月的时间即可顺利完成。
先来个简单的小游戏,用 Python 语言生成一个贪吃蛇游戏的代码。
讯飞星火 V3.0
ChatGPT:
二者都能够在极短时间内就生成一段可用的 Python 代码,差异较小。
再来一道代码的问答题:
ChatGPT:
讯飞星火 V3.0
讯飞星火和 ChatGPT 在应对这一挑战时表现出了出色的能力,两者都能准确地解答有关编程语言与自然语言转换的问题,并提供了详细的逐行解释。虽然 ChatGPT 对代码的解释侧重于其用途,但讯飞星火的解释则更为严谨,指出了代码中缺少函数定义结束括号的问题。
在科大讯飞的发布会中,他们宣布推出了一款基于讯飞星火V3.0的全新智能编程助手——iFlyCode2.0。根据刘庆峰的介绍,这款新助手在编程设计阶段能够提升50%的效率,在开发阶段则可提高37%,而在测试阶段则可实现44%的提升,这无疑极大地提高了软件从业人员的工作效率。
代码能力的提升只是讯飞星火 V3.0 升级的一部分能力之一。讯飞星火 3.0 在中文能力上实现了对 ChatGPT 的超越,我们来比较下二者在中文内容生产上的区别。
比如,我们让二者都分别拟定一个近期对马斯克的采访提纲。
ChatGPT:
讯飞星火 V3.0:
对比来看,讯飞星火的提纲更为充实,在一些重点问题上比如特斯拉及电动汽车产业上给出更专业、更细致的提问,比如提到充电设施的建设问题,采访提纲的深度和广度均有所保证,而不是像 ChatGPT 只是单纯地列出了一些访谈可能涉及的方向,显得有些泛泛而谈。
按照科大讯飞的理解,大模型不仅要能回答问题,还要能够提出问题,不仅是回答,还要能像人一样主动提出问题。
这就要说到讯飞星火 V3.0 在主动式交互上的进步了。刘庆峰介绍说,他们在讯飞星火的 3.0 版本上进一步提升了多轮对话能力,让大模型不再只是简单的信息咨询,而是多轮问话中能把问题问得更清楚。
这一特点运用得更为深入的是科大讯飞最新发布的讯飞星火医疗大模型。事实上,早在 2017 年,讯飞智医助理就已经通过国家执业医师资格考试,排名超过 96.3% 的人类考生,已经为基层医院及等级医院的医师提供服务。但是由于医疗场景的特殊性,科大讯飞在面向大众提供这一服务时十分谨慎。
现在,得益于讯飞星火 3.0 主动式交互的进步,讯飞星火 3.0 在医疗领域已经超越 GPT-4,磅发布了讯飞晓医生 App。在发布会中演示中,科大讯飞研究院院长刘聪专门实机演示了讯飞晓医的使用,它可以主动发问,主动丰富患者背景信息,通过多轮对话判断患者病情,科大讯飞将其称之为每个人的 AI 健康助手。
一切拿实测说话,我们用一个最简单的“肚子疼”的问题来分别提问 ChatGPT 和讯飞晓医。
ChatGPT:
ChatGPT 的回答虽然列出了许多建议,但其实并不能给出特别有效的就医信息。
讯飞晓医:
讯飞晓医在这方面要领先得多。首先它有针对性地先了解了患者的个人基本信息,然后再主动提问患者疼痛的特征、持续时间以及是否还有其他不良症状。在经过了多轮对话之后,讯飞晓医才给出了一份十分详尽的建议,包括可能的病情、需要医院的什么科室等等事无巨细都考虑到了。
这感觉,就像是在和医生面对面实际交流一样。对于平常去医院一向摸不着头脑、不知道该挂什么科室的人来说,这个 AI 健康助手实在是强大!
此外星火3.0还带来另一项重磅升级,个性化助手功能。简单理解,就是你可以赋予讯飞星火 V3.0 任何一个你可以想象到的人格,让它具有个性化的表达风格、情绪。你甚至还可以随时随地导入特定的知识以及历史的聊天记录,来让大模型形成个性化的记忆。
可以说,这基本上已经是个人 AI 助手的完全体了。
刘庆峰介绍,讯飞友伴推出 48 小时内后,首批用户就已经捏出了 3000 多个人设,大家对个性化 Ai 助手的追捧可见一斑。
不得不惊叹讯飞用户千奇百怪的想象力,比如你在这里可以和《变形金刚》中的“话痨威震弟”聊一聊汽车人与霸天虎的恩怨。
还可以和林黛玉共品《葬花吟》。
一句话总结:讯飞星火 V3.0 不愧是国产大模型的第一梯队,超越 ChatGPT 不是口头说说,而是实实在在地达到了领先和超越。
但我们也不能骄傲自满。科大讯飞的发布会上,刘庆峰也提到,国产大模型必须正视和GPT-4的差距。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。”他表示,唯有实事求是的科学精神,才能真正实现超越。
可喜的是,对标 GPT-4 的更大规模参数的星火大模型训练已正式启动训练,科大讯飞计划在 2024 年上半年实现对标 GPT-4 。
让我们拭目以待!
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!