21世纪经济报道记者白杨 北京报道
原内容描述了大模型浪潮的到来,让众多企业感到困惑和无助。然而,半年之后,字节跳动旗下的企业级品牌火山引擎通过实践探索,逐渐找到了自己的发展方向。
在6月28日的新闻发布会上,火山引擎正式推出了一款面向企业客户的大模型服务平台——“火山方舟”。该平台的核心功能是提供模型精调、评估和推理等服务,以满足企业在模型应用方面的需求。通过将模型作为一项服务提供给企业客户,火山引擎希望建立一个完整的MaaS(模型即服务)生态系统,帮助客户更高效地利用人工智能技术。
火山引擎总裁谭待对中国大模型发展的未来趋势做出了深入的判断。他认为,未来大模型市场将呈现出多元化的生态特点,这种生态将包括多个超大规模的大模型、多个中等规模的大模型以及众多针对特定行业的垂直模型,形成一个百花齐放的局面。这一判断的形成主要基于三个因素:其一是安全信任,这决定了大模型在市场上的生存空间;其二是行业壁垒,这些壁垒使得某些领域更容易形成大模型竞争的格局;三是成本因素,这些因素影响了大模型的开发和应用的成本,从而影响其市场份额。
在未来,特别是随着人工智能技术的不断发展,我们可以预见,大型企业在应用模型方面将采取一种“1+N”的策略。具体来说,这意味着企业将通过自主研发或与第三方模型服务商的深度合作,打造出一个主要的核心模型。而在这个核心模型的基础上,企业将在各种不同的应用场景中,同时运用多个外部模型,以满足各种复杂的需求。这种“1+N”的应用模式,既体现了企业对核心技术的掌握和创新能力,也展示了企业对多样化服务和灵活解决方案的追求。
聚合多方大模型
在此之前,我们已经看到多家云服务商纷纷推出了他们的MaaS服务,他们的共同点在于,他们的大多数方案都是基于一个通用的基础大模型,这个模型的设计目的是为了提供不同行业所需要的具有行业特性的行业大模型。
火山引擎以独特的方式,采用了聚合模式。据详细介绍,火山方舟已经融合了包括百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司以及科研机构的先进大模型。正是这种多元化的模型架构,让企业客户在火山引擎上能够轻松地同步试验多个大模型,并根据自身业务的实际需求,灵活选择最适合的模型组合。
在接受21世纪经济报道的采访过程中,谭待阐述了他对于火山引擎与其他厂商理念的不同看法。他提到,虽然友商推出了模型平台,并且在这个平台上构建了从模型到模型平台以及各种体系,但他们的思维似乎较为保守,认为未来只需要一种模型便可以满足需求。然而,谭待并不认同这种观点,他认为未来必定会呈现出多元化的模型形态,因此,他们的平台必须能够兼容并支持多种模型。
除了在理念层面上的差异外,谭待还指出,火山引擎之所以能够支持多模型架构,其中一个关键因素在于,业界许多优秀的大模型在训练过程中大部分都在火山引擎上进行。因此,我们与这些大模型之间建立了紧密的合作关系和互信,使得他们更愿意将推理任务交给火山引擎来处理。
对于哪些大模型可以进入火山方舟,谭待称,“我们希望火山方舟是一个精选的结果,所以希望那些确实是训练完成,并且在合规等方面都做比较好的,已经达到可用形态的大模型才放到方舟平台上。第一批公布的是7家,后面还会陆续接入更多大模型。”
当然,做聚合平台,也意味着火山引擎要面临更多风险和挑战。谭待表示,企业使用大模型,最担心的是数据泄露;如果将大模型私有化部署,企业将承担更高的成本,模型生产方也会担心知识资产安全。
据火山引擎智能算法负责人吴迪介绍,“火山方舟”已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,可适用于对训练和推理延时要求较低的客户。
此外,吴迪透露,“火山方舟”还在探索基于NVIDIA新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案,更全面地满足大模型在不同业务场景的数据安全要求。
聚焦平台而非模型
对于火山方舟平台,外界还关心的一个问题是:如果字节跳动有了自己的大模型,火山方舟会如何平衡自研和第三方模型的关系?
对此,谭待向21世纪经济报道记者表示,火山方舟会是个开放的平台,字节内部其他团队如果做好了模型,也会放到方舟平台上对外提供,它在方舟上就是众多模型中的一个。“最后选择字节的模型还是其他模型,这是由客户来做选择的,而不需要火山引擎来做平衡。”
所以,在服务模型应用方的过程中,火山引擎提供的不是模型能力,而是帮助应用方更好使用模型的能力。按照谭待的说法,火山方舟为企业提供的是大模型使用的一站式工作台,不仅包含了模型试用、评测、接入、精调等能力,也通过训推一体、弹性调度、算子优化等能力,帮助应用企业全面进行成本优化。
据吴迪介绍,企业可以用统一的工作流对接多家大模型,对于复杂需求可设置高级参数、验证集、测试集等功能,再通过自动化和人工评估直观对比模型精调效果,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。
在其看来,训练大模型很昂贵,但是从长期来看,模型的推理开销会超过训练开销。效果和成本的矛盾永远存在,降低推理成本会是大模型应用落地的重要因素,“一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。”
因此,企业在火山方舟进行的自定义指标和评估数据的积累,也将成为企业在大模型时代宝贵的数据资产。另据吴迪透露,字节跳动内部已有十多个业务团队在试用“火山方舟”,覆盖文本和图像生成、对话、代码辅助、信息检索、营销创意、电商、办公效率等领域。
吴迪表示,火山方舟希望在模型供应商和模型使用方之间,促成“研究-训练-应用-变现-反哺研究”的正向循环。“对模型提供方来说,火山方舟能够帮助大家以更低的成本触达海量客户,用更小的代价在ToB市场规模化;对模型使用者来说,则可以便捷地接触到众多高质量的基座模型,为不同场景选择最合适的模型。”
但谭待也坦言,“每一次技术的大变革,都会带来体验创新的新机会,而火山方舟还在起步阶段,工具链和下游应用插件需要持续完善。”接下来,火山方舟还将接入更多大模型,并逐步扩大邀测范围,加速大模型在各行各业的应用落地。
更多内容请下载21财经APP
大模型, 火山引擎, MaaS服务, 多模型生态
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!