字节跳动入局大模型很谨慎。
特别是今年以来,AI大模型赛道火热,百度、阿里、360等国内大厂先后入局,高调推出自家的通用大模型或者行业大模型。但字节迟迟没有动作,不禁引起业界好奇,字节跳动将会以什么样的方式切入大模型赛道?
字节大模型策略隐现
6月28日,字节跳动旗下云计算服务平台火山引擎发布“火山方舟”,这是一个大模型服务平台,为企业提供模型训练、推理、评测、精调等全方位平台服务。当前,百川智能、复旦大学MOSS、MiniMax、智谱AI等7家初创AI科技公司及科研院所的大模型被引入平台,成为火山方舟的首批“朋友”,对外出售服务。
这也意味着,字节仍没有发布自己的大模型,而是引入多家第三方大模型提供商,打造MaaS平台。一方面,模型提供方,通过 “火山方舟”能够以更低的成本触达海量客户,更小的代价在ToB市场实现规模化;这个关系有点像微软和OpenAI、亚马逊和Bedrock;另外一方面,对模型使用者来说,通过 “火山方舟”可以便捷地接触到众多高质量的基座模型,一站式对接多家模型提供商,为不同场景选择最合适的模型。按照4月份,火山引擎总裁谭待的说法,国内几十家做大模型的企业,七成已经在火山引擎云上。
今年年初,媒体普遍报道,字节跳动并未缺席大模型,早已有布局,分别在语言和图像两种模态上发力,如同百度推的文心一格和文心一言。不过该消息并未得到官方确认,字节跳动副总裁杨震原给出一个模糊的回应,字节跳动对大模型也在做一些学习和研究,现在还没有什么结果,也没有大模型产品落地时间表。
紧接着6月上旬,又有消息传出,字节跳动已经向英伟达订购了超过10亿美元的GPU,这一订单可能已接近英伟达去年在中国销售的商用GPU总和,这可以说明字节跳动的算力储备不输阿里云,百度。
同时,晚点也关注到,两年前卸任CEO 的创始人张一鸣也开始看相关论文,与一些团队交流心得。按照谭待的说法,他们将来还会引入更多大模型,字节跳动如果能做好自研的大模型,除了应用到业务中,也会放在平台里对外销售。
由此不难判断,随着火山方舟的发布,字节在大模型赛道的策略正浮出水面:“自研+平台”两条腿走路。相信很快,就能看到字节自研大模型的正式亮相。这也符合字节跳动过往的风格,不会立马跟风,在研发大模型上吹牛,而是闷声干事,然后整个大动作。
火山方舟的价值
根据火山引擎总裁谭待的判断,未来大模型市场将是一个百花齐放的多模型生态:在未来,企业自身对于大模型的应用,将会是一个“1 + N”的应用模式,即一个主力模型和N个外部模型协作的模式。这与其此前大模型市场不会出现少数几个大模型通吃的局面的观点一致。企业会用多个模型开发应用或改造业务,火山方舟大模型服务平台由此诞生。
那什么是火山方舟?简单来说,火山方舟是一个行业大模型精选商店,基于火山引擎的能力,对模型精调、推理、评测,模型使用者可以在商店里挑选行业优秀的大模型平台,放心使用。这客观上降低大模型的使用门槛,推动大模型和大算力的应用落地,加快大模型在各行业发挥商业价值。也就说,火山方舟在起步阶段就集成多个大模型,供使用者直接对比,帮助客户为不同场景精调模型,“跑完最后一公里”。
火山方舟作为模型提供方和模型使用者平台型粘合剂,已经提供了具体的“撮合路径”,促成“研究-训练-应用-变现-反哺研究”的正向循环。具体来看,“火山方舟”基于大模型应用的工作习惯,打造了多个核心部分。“模型广场”会有不同的模型供应商提供不同版本和尺寸的模型,用户可以直接与模型交互,调用推理API,接入生产环境;“模型评估”是“火山方舟”重点打造的环节入口,用户可以基于业务需求设计一套可量化的评估指标,在模型评估后挑选最合适的模型;“模型精调”可以帮助客户利用自有数据进行持续训练,建设和积累自己的精调数据集,降低推理成本。
此外,为解决企业使用大模型对数据泄露的担忧,促进模型提供方和模型使用方的互信。“火山方舟”上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了大模型安全互信计算,可确保企业客户数据资产安全。
据了解,目前,抖音集团内部已有十多个业务团队试用“火山方舟”,在代码纠错等研发提效场景,文本分类、总结摘要等知识管理场景,以及数据标注、归因分析等方面探索,利用大模型能力促进降本增效。
这些内部实践是“火山方舟”成熟的磨刀石,快速推动火山引擎大模型服务平台能力的完善。
由此,火山引擎的大模型变现路径规划也逐渐明晰:向大模型初创公司提供算力支持。这是因为,一方面,字节跳动有丰富的算力储备,正如谭待多次明确,火山引擎自己不做大模型,火山引擎可以调度抖音等业务的空闲计算资源,出售给大模型厂商。另外一方面,大模型厂商可以不用浪费资金和时间去“重复造轮子”。
火山引擎总裁谭待在2023火山引擎V-Tech体验创新科技峰会上表示,大模型已经当仁不让地拿起了技术革新和体验创新的接力棒。但如何接下这一棒,每个公司的方式都有所不同,与字节类似,腾讯至今也未急于发布自研大模型,也是优先推出MaaS大模型服务,提供类似“火山方舟”的服务,马化腾说“不急于一时”。从这个角度来看,大模型不是一天两天的事儿。
好饭不怕晚,大抵如此。
唐辰同学,关注互联网科技及商业故事。原创内容,未经许可,谢绝转载。