火山引擎推出“AI助手”:数据飞轮助力企业数据驱动

火山引擎10个月前更新 lida
80 0 0

文章主题:火山引擎, 数据飞轮, AI助手, 大模型

666ChatGPT办公新姿势,助力做AI时代先行者!

火山引擎升级数据飞轮,发布首款大模型数据产品“AI助手”

火山引擎推出“AI助手”:数据飞轮助力企业数据驱动

AI加速数据驱动。

作者|赵健

字节跳动的大模型又有了新的进展。

目前为止,字节跳动已经公开发布了三款大模型相关产品:

第一款是火山方舟,这是火山引擎在今年6月发布的MaaS云产品,其中集成了市场上主流的第三方大模型。

作为一名文章写作高手,我将按照您的要求对原文进行改写。在本文中,我们将讨论抖音推出的类ChatGPT对话机器人产品“豆包”。该产品的底层技术源于字节跳动自主研发的云雀大模型,并在8月31日正式通过了备案并对外公开。抖音推出的“豆包”聊天机器人基于自家的云雀大模型,这一技术平台在国内外都享有盛誉。作为一款类ChatGPT产品,“豆包”具备强大的自然语言处理能力,可以模拟人类用户的对话方式,为用户提供更为智能化的交互体验。值得一提的是,“豆包”在8月31日正式通过备案并公开上线。这意味着这款产品已经获得了相关部门的认可,可以正式与广大用户见面。作为一款创新的对话机器人产品,“豆包”有望在抖音平台上发挥重要作用,进一步提升用户体验,推动抖音在人工智能领域的不断发展。

刚刚发布的火山引擎数据产品“AI助手”是我们团队打造的一款全新的产品,作为火山引擎的首个数据产品,它具有接入大模型功能的特点,能够有效帮助企业在数据处理和查询分析等方面实现突破性进展。

火山引擎总裁谭待表示,数据飞轮作为大模型在企业市场中应用的重要途径,具有降低企业挖掘数据价值难度、提高数据处理效率的优势。他认为,借助AI技术增强的数据飞轮,将为企业实现数据驱动提供全新模式。

相比其他大厂,字节跳动对于大模型的态度相对低调。但是大模型浪潮,字节跳动绝不会缺席。

1.“AI助手”是什么?

本次火山引擎发布的“AI助手”,是火山引擎数智平台产品接入大模型的一次实践。

火山引擎数智平台(Volcano Engine Data Intelligence,简称VeDI)自2021年12月2日起正式面向公众推出,现已发展成为一个涵盖IaaS、PaaS、SaaS、解决方案以及咨询等全方位的端到端云上数据产品。

火山引擎推出“AI助手”:数据飞轮助力企业数据驱动火山引擎数智平台产品图

火山引擎数智平台的前身为字节跳动数据平台产品,该平台不仅积累了字节跳动在数据领域的卓越经验,更将数据驱动的理念深深融入了公司的文化中。

在使用人工智能助手时,我们可以通过两种途径与大型模型进行交互。首先,我们可以直接连接到字节跳动自主研发的云雀大模型。其次,我们也可以借助于火山引擎在今年六月份推出的火山方舟MaaS平台,从而将第三方模型,例如智谱AI、百川智能以及MiniMax等接入到AI助手之中。

字节跳动数据平台负责人罗旋表示,大模型在数据产品中的应用,也改变了字节跳动内部探索数据价值的方式。

火山引擎推出“AI助手”:数据飞轮助力企业数据驱动字节跳动数据平台负责人罗旋

当前,数智平台VeDI的两大解决方案已经成功接入我国自主研发的大模型技术——DataLeap大数据研发治理套件和DataWind智能数据洞察系统。其中,DataLeap是一款PaaS(平台即服务)产品,而DataWind则是一款SaaS(软件即服务)产品。这两款产品的引入,将进一步提升数智平台VeDI的性能和服务质量,为广大用户提供更加便捷、高效的数据分析和处理手段。

罗旋认为这两款产品已经覆盖了数据生产与消费全链路场景的绝大多数环节,可以概括为三个:

数据资产的查询和开发,是数据消费的前置步骤。非研发人员利用“DataLeap找数助手”模块,通过问答式检索,能高效准确找数,实现员工自助数据消费第一步;

数据生产环节,基于DataLeap开发助手模块,使用文字描述或数据模型,就可以自动生成代码、一键优化,以及对话式咨询SQL使用问题等,让数据开发简单高效;

数据洞察方面,利用DataWind分析助手,非专业分析人员通过自然语言对话,可完成SQL查询修复、自动生成可视化图表和飞书对话式分析等一系列业务探索,缩短数据分析周期。

火山引擎总裁谭待指出,VeDI的两款产品不仅降低了非专业人员数据使用的难度,同时也让专业人员得以解脱,让他们能够更加专注于处理复杂的需求,从而提升研发生产的效率以及代码的质量。

罗旋承认,大模型的“幻觉”问题今天为止还没有彻底解决。所谓幻觉,就是指大模型生成的内容,不是基于任何现实世界的数据,而是大模型自己想象的产物,即“一本正经地胡说八道”。

但罗旋表示,我们可以通过一些方法,一定程度上缓解精确度的问题。比如,把AI的推理过程“白盒化”,以产品化的形式向用户展示,如果出现错误用户可以及时地发现。这是当前最重要的思路之一。

另一方面,模型本身能力的提升也会缓解这一问题,比如GPT-4在解决“幻觉”能力上要比GPT-3.5有巨大提升。同时,在基础模型之上加一个行业专属语料做精调,也可以降低幻觉,提升准确率。

大模型在数据产品中的应用,在字节内部业务比如抖音电商实践中已初步获得成效。

目前,字节跳动内部80%的员工可以直接使用数据产品,可管理、运营的数据资产覆盖80%的日常分析场景。

数智平台AI助手已经开启内测,但还不会大规模开放。火山引擎会邀请一些客户深度共创,计划等产品打磨成熟时候再对外公开。

2.数据飞轮升级

在企业软件领域,数据处理与分析类产品是一个比较成熟的主场,市场上有大量的大数据公司、数据中台公司。

比如,海外比较知名的大数据公司有Snowflake、Databricks,两者今年在大模型领域也做了大量布局。

在被问及与Snowflake的区别时,字节跳动数据平台负责人罗旋表示,Snowflake本质上是一个数据仓库引擎(PaaS层),在功能做大之后开始向上往数据分析的产品矩阵方向发展。而火山引擎一开始更强调上层业务,比如A/B测试这款SaaS产品完全没有对标,然后再完善数据资产到数据底层能力的建设。

“如果用数据飞轮来比较,我们更强调两个轮子——数据应用与数据资产建设能力的兼备。”罗旋表示。

这两种数据能力建设思路的不同,一定程度上反映了中外企业对数据的应用能力的不同。

在中国市场,不少企业数字化建设较多,却无法较好释放数据价值,存在数据建设与管理成本高、数据产品使用门槛高、数据资产价值低的问题。这是一个普遍的痛点。

火山引擎总裁谭待认为,原因在于业务和数据之间没有形成双向良性驱动。“数据消费是目的,数据中台建设是手段,过去很多企业错把手段当成了目的,因此即使建设了数据中台,也不知道怎么用起来。”

为解决这一痛点,今年4月,火山引擎对外发布企业数智化升级新模式“数据飞轮”,核心要素就是做好“数据消费”。

火山引擎推出“AI助手”:数据飞轮助力企业数据驱动火山引擎数据飞轮

如何理解数据飞轮与数据消费?

过去的数据中台建设通常都是一个技术问题,但技术与业务之间常常存在割裂。得到App联合创始人&CEO脱不花,也在现场也分享了得到业务团队与技术团队在数据治理之前针对数据的非共识。

而在数据飞轮理念下,数据能力的建设都是业务驱动,跟客户不是先聊技术,而是先聊业务。如果现有的数据产品,比如AB测试/已经满足应用,那就直接开箱即用;如果不能满足需求,再考虑进行数据资产的建设。

这听起来似乎是一个很简单的理念,但对于数据服务商却提出了更高的挑战,因为它要求数据服务商要尽可能地了解行业、甚至更细节的业务场景的业务逻辑。这并非技术问题,而是需要长时间的行业经验的积累。

火山引擎之所以提出数据飞轮的理念,最核心的原因,就是这是基于字节跳动自身数据实践,是一套已经被验证过的方法论,并沉淀在相应的数据产品中。

产品无法满足的,好可以通过咨询服务来满足。火山引擎专门设置人员来提供UG咨询服务、数据BP咨询服务,解决客户早期的业务问题。

所以,这是一套短期内难以复制的数据理念。某种程度上,这才是火山引擎数据产品最大的竞争壁垒。

大模型的出现与数据飞轮的理念相吻合,因为两者都是在降低数据使用的门槛,让数据更高效地发挥业务价值。

谭待表示,构建以数据消费为中心的数据飞轮,将是企业数字化建设的必然趋势,“火山引擎VeDI还将进一步升级,通过AI+数据飞轮持续降低数据消费门槛,充分释放企业的数据价值,帮助企业更好地从数据中获取增长的动力。”

(封面图为火山引擎总裁谭待,图片来自火山引擎)返回搜狐,查看更多

责任编辑:

火山引擎推出“AI助手”:数据飞轮助力企业数据驱动

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

© 版权声明

相关文章

暂无评论

暂无评论...