讯飞星火何以燎原?因为人间清醒!

讯飞星火7mos agoupdate lida
125 0 0

讯飞星火何以燎原?因为人间清醒!

出品 | 子弹财经

作者 | 古月

编辑 | 闪电

美编 | 倩倩

审核 | 颂文

中国正在试图成为全球唯二的人工智能策源地,但有很多基本的问题并未解决。

中国有世界上最发达的制造业,几乎没有中国造不出来的消费品,这就导致了任何功能只要一推出,市场上很短时间内就有类似的产品。

但人工智能的发展规律和制造业不同,它需要知识、智慧和灵感,也需要算法、算力和数据,更需要可以形成共识的标准、 技术体系和商业化落地能力。

作为人工智能国家队,科大讯飞“星火”大模型的发布,并没有和一众企业去抢时间、抢首发,而是选择了一个适中的时间,展现了令人信服的能力,并且直言自己的所长、不足和目标。

在“群模乱舞”的时代,我们需要的是星火燎原,也要一份人间清醒。

1、群“模”乱舞

2023年,可谓是生成式人工智能的关键一年。国内AI大模型已经遍地开花,无论是科技大厂、还是初创企业均纷纷发力。

在这样的背景下,5月6日,科大讯飞在总部所在地合肥,而不是北、上、广、深等一线城市,发布了旗下首款AI大模型——星火认知大模型,可谓是相当低调。

讯飞星火何以燎原?因为人间清醒!

坦率地说,对于目前各类企业纷纷发布大模型,或者宣布引入大模型能力,推出相关产品的商业现象,笔者持有保留的乐观和更多的怀疑。

总体而言,推出大模型的企业有两类。第一类是有长期AI研发历程,在技术、人才储备、发展路径探索、算法算力等核心要素方面比较齐备的企业,如百度、阿里、科大讯飞等。

第二类,则是新组建的创业团队,其中部分由资深的AI产业大佬带领新创团队,也有不少是我们从未听过的新组合。

对第二类企业,笔者并无偏见。因为研发出ChatGPT的openAI就是一家小体量公司,甚至可以视为一家实验室,其发展历程也只有短短的几年,员工不过数百。这充分说明,在AI的研发上,人数并不是绝对要素,选对关键的路径和制定清晰的目标,更重要。

在观察行业多场大模型发布会后,笔者逐渐形成了一种认知,即对于企业来说,一项靠谱的大模型战略,应具备三点:

第一,能够提出明确的能力度量标准。也就是说,无论是自己和自己比,还是和行业前沿企业对比,都能提出一套清晰、明确、易于理解的度量标准,而非使用大量的营销式词汇,说得天花乱坠但却让人不明就里;

第二,也更为重要的是,能够明确地提出商业化落地的路径,如有成熟的产品作为实证更佳。因为人工智能的发展并不仅仅是为了打榜和讲故事,而是实实在在地创造社会价值和经济价值;

第三,对未来的发展有清晰的规划,对自己的优势和不足都能够客观地评价。相对来说,后者更为难。

在厘清了这三条标准之后,笔者发现,科大讯飞星火大模型的发布,近乎完美地实现了以上标准——它也许不是最炫酷的,但确实是最让人感到踏实、务实和诚实的,它让人信任,也让人期待。

2、星火燎原 厚积薄发

和诸多大模型在命名上或者搜罗东西方文化,或者乞灵于上古神话不同,科大讯飞的星火大模型在命名上通俗易懂,取义于“星星之火 可以燎原”的含义,简单直白。

而让笔者感到星火大模型带来震撼的是,在绝大多数企业大模型发布会基本上都是在展示对话、作图、交互等功能片段的当下,星火大模型拿出了完整的应用层产品矩阵,并进行了充分的现场实时演示。

从这个角度看,这是一场最“实在”的发布,也是商业化落地清晰度最高、颗粒度最细的一次发布。

在本次发布会上,围绕星火认知大模型“1+N”架构中“N”个领域的内容,科大讯飞发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果,其中既有to C的产品,也有to B的产品,展现了端到端的优化能力,能力布局非常均衡。

例如,在教育场景中,前几年曾掀起一阵AI热,但很快又归于寂寞。其原因是大部分企业拿出的AI能力只能算是解决方案中的一种噱头,缺乏实实在在的替代性能力。而在这次展现的星火大模型+AI学习机的产品中,AI已经成为真正的主角。

讯飞星火何以燎原?因为人间清醒!

早期的AI学习机,大部分只搭载了基于机器学习的弱人工智能能力,充其量可以解决一些如标点符号错误、基本语法错误的纠正,并不能解放老师或家长,反而增加了学生的时间成本,在人机的艰难协同中举步维艰。

而科大讯飞这次拿出的AI学习机,由于搭载的是最新的生成式AI技术,所以无限接近于“像真正的老师一样工作”,可以实现围绕写作要求分析全篇结构和文采的深度高阶批改,甚至可以实现写作思路启发,利用AI润色技术生成片段优化参考和写作建议提升,让孩子在启发中精准提升——而这甚至超出了很多家长乃至老师的能力。

讯飞星火何以燎原?因为人间清醒!

在口语对话方面,科大讯飞AI学习机精通中英双语,不仅发音纯正、表达地道,孩子直接说中文也能翻译成英文并教孩子朗读,还能对孩子的发音进行评分。

如此精确地针对学习难点和痛点去设置功能和解决方案,势必需要长期教育行业的实践和know-how。星火大模型在教育领域的应用落地,正是科大讯飞多年来厚积薄发的证明。

“大模型+智能办公本”,更是不少参会者在发布会后产生购买冲动的一款产品。

事实上,作为资深文字工作者,笔者在此前已经测试过许多生成式大模型的文本能力。在惊叹技术进步的同时,发现最大问题就是强大的生成能力并不能有效地与实用场景相结合,以至于不得不对生成的文本进行大量的修正、编辑、审校、提炼,从而产生了一种“不是AI在为我服务,而是我在给AI打工”的错觉。

而体验“智能办公本”则颠覆了我的认知。

此前,笔者虽然已经使用语音转文字功能很多年,但仍对口语稿阅读困难、纪要整理耗费精力、以及双语切换环境下各种无穷无尽的错漏乃至奇葩的文本深感痛切。

这款产品不仅可以形成精简的会议纪要,更震撼的是在“语篇规整”方面,它一举扫除了语音转写文稿中的口语化词汇无法准确呈现、冗余,断句不准确等深层痛点,甚至还可以对文本进行轻度优化,在无损原意的情况下,把一篇语音转写文稿规整成体面的书面化内容。

讯飞星火何以燎原?因为人间清醒!

如果说以上的两个功能是在讯飞的传统“好球区”,那么在汽车场景、生成式RPA(机器人流程自动化)等toB能力上的释放,则展现了科大讯飞更大的雄心。

智能座舱是目前新能源汽车的重要卖点,而其核心中的核心,主要就是用语音指令替代手工操作——而对于这一趋势,汽车行业的从业者和用户的评价通常是两极分化。

而对比过许多智能座舱之后,笔者发现,造成两极分化的原因,并不是用语音指令替代手工操作的大方向有问题,而是部分汽车搭载的语音对话能力过于贫弱所致。

科大讯飞的产品力则非常惊艳。例如“多轮对话”能力,看似只是解决了用户如同念诵咒语一般需要反复使用唤醒词的痛点,但这一功能被认为是传统语音助手最难突破的能力之一——因为多轮对话对于语义的结构化、逻辑化乃至运算能力的要求是指数级的增长,以至于很多对话类产品都将其列入“体验选项”,迟迟不能实现成品化的突破。

科大讯飞的智能座舱,除了自如流畅的多轮对话外,还可以分辨多人的语音,实现分区域的开启空调、加温等功能,甚至还能区分主驾、副驾等,从而来判断语音响应的优先级,让车载人机交互提升了一个新的台阶,从而在强手如林的国内汽车智能语音应用市场中,一直保持占有率第一。

讯飞星火何以燎原?因为人间清醒!

另外,最近一个to B领域的火爆话题就是ERP系统的国产替代。其中,科大讯飞首创新一代基于大模型的生成式RPA,让数字员工更智能,解决了一个重要命题。

传统的ERP中的数字员工通常指的是RPA(机器人流程自动化-Robotic process automation,简称RPA),已经应用地非常广泛,即使用内置程序实现类人的工作。

人机交互一直是RPA的短板。然而,基于星火大模型的自然语言生成业务流程加持下的RPA,使“数字员工”具有了真正的“人”的光彩。

例如,作为一种尖端的语言模型,它能够生成类似人类的文本并高度准确地回答问题,这有可能彻底改变企业员工与其ERP系统交互的方式,使员工更容易、更高效地访问他们完成工作所需的信息;它也可以根据应用环境化身为“虚拟人智能交互机”,在导购、客服、智能营销方面实现类似人工客服的交互能力,使得“24小时不打烊的服务”得以真正地实现。

应用层能力的成熟度、大模型的泛化能力、与to C和to B真实痛点的解决,使得星火大模型成为目前诸多大模型中最为成熟的一个,也是最吻合人机协同的平衡点的一个。它让我们真正地目击而非脑补地看到了生成式AI的诸多社会价值和商业价值,也极大地坚定了用户的信心。

最直接的回应,就是科大讯飞的股价在发布会后直接涨停,这也是诸多大模型发布中少见的一个现象。

3、务实的背后是什么?

用务实、接地气、商业化前景明确,已经不足以概括笔者对这次发布会的印象。

事实上,科大讯飞通过发布会展示的每一个动作,都有深层次的商业逻辑和科学逻辑做支撑。

例如,股价涨停只是一个现象。这个现象的背后,有一种底层逻辑叫做“投资者能够看到并且信赖的预期”。

为什么发布会那么多,投资者独独对科大讯飞的预期格外信赖呢?

某种程度上,这就是因为科大讯飞牵头发布了国内首个“通用认知大模型评测体系”,而且,这个体系并不是“自己评测自己”,而是通过与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨,才形成了覆盖7大类481个细分任务类型的完整体系。

这不仅能够在科学的评测体系中,推动大模型的发展;也使得讯飞大模型的能力能够透明化、动态化地持续展示其发展和进步,而这给予了投资者深层次的预期吻合和安全感。

再比如,我们看到的诸多应用层产品,其灵感似乎无穷无尽,但自有其内在规律,这就是近期影响力很大的一部名作《未来呼啸而来》中提出的“叠加式创新”。

所谓的“叠加式创新”,是指目前诸多强大的技术如量子计算、人工智能、元宇宙等都到了出现涌现式创新的关键阶段,而其要点不在于技术本身,而是技术与技术、技术与场景、能力与需求之间,是否能够实现快速地把科技价值与场景叠加,从而和场景结合,充分满足需求,进而通过解决实际问题而产生出新的经济价值。

而科大讯飞这次展示的所有产品,几乎都符合叠加式创新的概念,真正展现了人工智能所赋能的未来是如何“呼啸而来”的。

讯飞星火何以燎原?因为人间清醒!

最后也是最重要,同样是不可避免的,是讯飞必须回答自己与行业标杆,也就是ChatGPT之间的能力对比、长短优劣的问题。

科大讯飞不仅客观地与ChatGPT进行了对比,更重要的是公布了年内大模型技术持续升级的三个关键里程碑节点——

6月9日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级;

8月15日,代码能力升级以及多模态交互能力提升,希望能帮助到更多的合作伙伴及开发者团队;

10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。

究竟是如何规划出这三个节点并不是我们要讨论的重点,而是它象征着一种科学的精神和严谨的态度,也就是——

第一,做了详细的对比,分析具体的优势和差距,代表了一种客观的态度;

第二,做了详细的规划,说明科大讯飞知道自己要做什么,和怎么做;

第三,预估多久能做到,说明对自己有清醒的认识,也对对手和行业标杆,有同样清醒的认识。

在这样的一种难得的人间清醒里,科大讯飞也成为目前国内屈指可数的给出赶超行业标杆时间表的企业,而且这个时间表有标准、可度量、可预期,具有一种令人信服的严谨,这不仅仅是对自己的负责,也是对行业和社会的一种承诺和担当,更是我们能够看到的中国人工智能发展的未来曙光。

© Copyright notes

Related posts

No comments

No comments...