火山引擎入局大模型之战，却为何不走寻常路？

火山引擎1yrs ago (2024)update lida

80 0 0

导语：

火山引擎以一种新的姿态加入了大模型赛道的竞争，那就是基于开放的大模型服务平台模式。

可以想见的是，目前已经有如此多的企业聚焦大模型，可以说在供给侧，未来的大模型能力会和水、电、煤一样俯拾皆是。

所以，对于用户来说，不用担心没有大模型可用，反而要担心如何解决选择困难症；而对于大模型企业来说，要担心的则是推广难、获客难。

而火山引擎推出的“火山方舟”大模型服务平台，不仅为诸多大模型提供了渠道、服务链路和平台，也非常适合企业采用轻量级、多尝试、易解耦的策略，广泛的尝试多家大模型提供商不同的大模型服务，让时间和实践成为最后选择的指导，让大模型生态更加自然而健康的生长。

1. 火山引擎&大模型，另一种形态的爆发

时间进入炎热的7月，大模型赛道的热度仿佛叠加了气温，更加的炙手可热。

既有王兴接盘自己老队友的初创大模型企业这样的业内轶事，也有6月28日V-Tech体验创新科技峰会上，火山引擎推出名为“火山方舟”的大模型服务平台的重磅行业新闻。

不过笔者发现，很多读者在激动之下，很容易犯一个错误——把大模型和大模型服务平台弄混。

大模型和大模型服务平台，完全是两码事。

前者好比是一块CPU或GPU，解决的是一个核心部件的功能、性能问题；后者好比是一个商城，在这里你可以选择不同的模型以及相关的精调、评测、推理等一整套服务。

一个强大的零部件和一套完整的服务，商业价值上有巨大的差距。

比如在数字时代里，虽然我们每个人理论上都拥有一块或几块CPU，乃至我们的每一次触碰和点击，都要用到CPU。但是实际生活中，我们都是通过使用iPhone这样的整机来间接的使用CPU的。

所以某种程度上，一个解决方案的完全体，比核心零部件提供商的商业想象空间更高——全球CPU霸主英特尔的市值是1300亿美金，炙手可热的GPU霸主英伟达的市值是1万亿美金。

但苹果公司的市值却是3万亿美金。

说回这次火山方舟的发布——其实，火山引擎在今年的春季Force原动力大会上就明确表示不会做大模型了，解答了“不做什么”的问题。

而这次火山方舟的发布，解答了“做什么”的问题。

简而言之，就是火山引擎发布的大模型服务平台“火山方舟”，它面向企业提供模型精调、评测、推理等全方位的平台服务（MaaS，即Model-as-a-Service）。

它最大的特点，就是把各家的百花齐放、各具特色的大模型，集合到自家的平台上，基于独特的多模型架构，让应用企业可同步体验、尝试、应用多个大模型，进而选用更适合自身业务需要的模型组合。

仅仅在邀请测试阶段，火山方舟就集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型。

某种程度上，这等于把这七家企业的大模型，一下子提速到了马上可以落地应用的阶段，大模型服务平台的产业价值，也骤然彰显。

2. 头部赛道的差异化打法

虽然在6月28日这天，火山引擎并没有推出自研的大模型，但就凭火山方舟的创新服务模式，火山引擎成为了目前国内大模型赛道的最大变量之一，把自己拉到了中国“模型即服务”的第一阵营。

作为全球AI唯二的创新源地，国内目前的大模型赛道可谓“群模乱舞”，但能够进入第一阵营的只有区区几家而已。

例如阿里巴巴，它在中国云计算市场上仍然处于头部优势地位，而“模型即服务”也属于广义云服务的范畴。

由于长达十几年的云计算研发、运营经验，和AI、BigData、cloud三者融合的必然趋势，阿里巴巴在云计算相关的软硬件上都做了广泛深入的投资，技术底蕴雄厚，例如其大模型基于阿里云、达摩院打造的硬件优势，可将大模型所需算力大幅度压缩。

另外，阿里全自研的底层技术优势，也非常有利于构建AI服务的统一底层，这些都属于战略级而非战术级的优势；阿里的通义千问，也是国内第二家发布的生成式大模型。所以可以说，阿里目前已经可以基于自身大模型，向市场提供实际落地的大模型服务。

百度也不可不提。作为国内AI研发的正规军之一，百度应该是国内最早投入AI研发的互联网企业，多年累积投入千亿以上，生态建设全面。包括有深度学习框架—飞桨，有非常适合产生AI的业务——搜索……以及国内首发的生成式大模型——文心一言及其云服务模型“文心千帆”等。

火山引擎总裁谭待并不否认这些头部企业的优势，他指出，目前国内大模型市场的最顶层，还将是几家超级平台支撑的超级大模型并存的格局，这种存在是不可否认的。

图：火山引擎总裁谭待

那么，火山引擎作为相对的后来人，它的战略设计有何独特之处？

在笔者看来，火山引擎的打法，就是坚定走自己“多云多模型”的路，而不是跟着别人的节奏起舞。

所以我们看到，虽然火山引擎不直接做大模型，但通过为大模型企业提供AI基础设施，国内几十家做大模型的企业，多数已经在火山引擎的云上。

又比如，由于大量的服务于大模型企业，也使得火山引擎针对大模型的服务支撑不断强化，并打造了深层次的软硬件一体化能力，如火山引擎的自研DPU，将通信优化的算法直接写到网卡硬件中，以降低延迟、削减拥塞等。

如是的类似技术细节还有很多，但笔者认为，真正关键的不仅仅在于火山引擎的技术，还有它为大模型赛道设计的独特模式和竞争策略。

3. 多云多模型和1+N

从AI到大模型，从大模型到大模型商业化落地，其中最大的堵点，主要不是技术问题，而是商业模式问题。

Chatgpt出现之前，各家企业的AI商业化落地，都磕磕绊绊。其实最大的问题，是没有让用户看到价值，同时也不容易让用户感受到价值。

Chatgpt出现后，大家都对AI的价值看的很清楚了，但问题是，什么样的商业模式才能迅速让大模型的优势得以发挥。

这就涉及到对大模型应用模式的底层逻辑判断。

而谭待告诉笔者，他认为未来大模型应用最核心的两个特征，是“多云多模型”和“1+N”。

所谓的多云多模型，指的是——未来的企业会同时选择不同层次的多个模型和多家企业的云服务，来解决不同层次的问题。

“未来大模型赛道的格局，会是少数几家超级模型+一部分通用大模型+很多垂直领域的细分模型”，谭待说：“这就和企业用工一样，不是所有的问题都要博士毕业的员工才能解决，博士干博士的活儿、硕士、本专科生也都根据自己的能力干力所能及的工作，才是一个相对的最优解。所以未来的大模型赛道也会是，一个企业会同时用到多种模型和多种功能。”

但模型又并不是越多越好，过多的模型增加了试错的成本，增加了技术的复杂性，所以火山引擎的判断是，未来较大的可能是，一个企业选择一个主要的大模型作为主干，同时选择多个专用模型解决不同的问题，也就是“1+N”。

无论是哪一种模式，都面临一个底层逻辑——火山方舟这样的大模型服务平台，要能提供尽可能多的选择、组合，同时提供高水平的服务。

我们可以从用户和大模型提供商的角度，来看这种服务逻辑的优点。

先从对大模型用户的突出优点来看。

第一个优点，是可以快速的“试穿试用”。

火山方舟目前集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等，未来可想而知的还会集成更多的大模型提供商。在火山方舟的统一支撑下，企业可以灵活选择、低成本试错，不用跨平台就能寻找更适合自己企业的模型服务。

第二个优点，是获得与模型提供商一致的服务。

火山方舟的“模型精调”模式，就是一个实用价值很高的服务。

火山引擎智能算法负责人吴迪指出，从短期看，训练大模型很昂贵，但是从长期看，模型的推理开销会超过训练开销。

图：火山引擎智能算法负责人吴迪

这意味着，模型并不是越大越好。例如，微软以医学文章为主要数据集，精调了生物领域的BioGPT-Large模型，仅有15亿参数，但在 PubMedQA 基准测试中的准确率，却优于有着上千亿乃至数千亿参数的大型通用语言模型。

而“火山方舟”提供了丰富的模型精调和评测支持。甚至可以让一家企业用统一的工作流对接多家大模型，再通过自动化和人工评估直观对比模型精调效果。

而精调其实也是需要很高的技术门槛的，所以火山方舟还将通过提供运营干预工具，让用户可以快速设置相关规则，这样在模型已经投入使用后，无需精调模型即可干预模型输出结果。

总之，是怎么便宜、实用、方便，就怎么来。

第三个优点，是超强的安全性。

聚合多模型、服务多用户，这样的架构决定了一个问题会被凸显出来，那就是安全问题。

既有模型服务商的安全问题，也有用户的安全问题。前者在意大模型的源代码安全，后者在意自己独家且精调过的数据的安全。

而火山方舟对用户的需求把握精准，通过互信计算框架，满足基于不同客户的安全和隐私保护诉求，设计了包括安全沙箱、可信硬件以及联邦学习方案，来保证合作的多方在互信的基础上推理、精调等，让模型提供商和用户都更加放心的使用。

这将是火山方舟的一个重要竞争力。

接下来，我们再分析一下火山方舟模式对于大模型服务商的优势。

首先，火山引擎作为一个成熟的云计算服务商，将很好的提升大模型企业和市场对接的效率，让大模型企业跳过“冷启动期”。

其实，无论是大模型开发企业单独提供服务，还是通过火山方舟平台，服务用户的路径在原理上基本是类似的。

但对于大模型开发企业来说，特别是在早期，单独修建这样一条服务路径的成本不仅很高，而且只能由企业自身承担，这样效率不仅低下，成本也很难被摊薄。

而加入火山方舟就相当于把商品放进了成熟的渠道，不但可以共用路径、共享服务，还可以得到火山引擎的能力加持，等于说跳过了冷启动阶段，直接进入了服务落地阶段。这对于初创大模型企业的吸引力十分巨大。

其次，火山引擎提供了应用企业所需的、完整的技术支持。

火山方舟一切从实际需求出发来提供服务——模型厂商担心算力和工程稳定性，火山引擎就提供技术支持；大模型要真正应用，安全信任和推理成本问题必须解决，火山方舟就实现了安全互信计算；更不要说，还有前叙的模型精调支持、训推一体等服务，并且可以通过公有云的弹性，帮助厂商降低成本。

最后，随着越来越多的模型被集成，有可能酝酿新的模式和能力。

我们反复的讨论过，无论是“多云多模型”还是“1+N”，本质都是不同层次、不同功能的模型能力的组合。而火山方舟的开放性，决定了这种组合是跨平台的，其组合形态和数量级会指数级的提升，因而，也为酝酿出基于全盘的最优组合乃至跨越式创新提供了机会，它不仅将成为模型服务的集合者，也会成为模型服务的创新平台。

结语：

客观的说，虽然大模型之战非常火热，但其实总体上来说，还是很初级的阶段，而其原因是多方面的：

一个是大模型技术远远没有固化，未来发展可期；

一个是现在对大模型发展路径已经开始发生争议，未来发展充满挑战；

一个是大模型的商业化落地还在探索，这才是最终决定大模型的价值体现的关键一步；

但是，很显然，大模型的开发，并不是任何企业都可以胜任的。未来这个赛道会有非常细的生态分层，例如最具实力的去开发超级大模型，有一定实力的可能专攻产业级大模型，甚至精调、预训练、数据等领域都会产生新的独角兽。

而火山方舟的价值在于，在赛道的极早期就卡位在聚合多模型的大模型服务平台的定位上，为未来发展繁衍出超级生态进行了周到的布局。

当然，不得不说的是，多模型聚合是未来模型即服务的方向，现在也有越来越多的企业宣布自己集成更多的大模型，这既是这个赛道发展的必然，也是火山方舟未来也要面对更激烈的挑战的前奏。

# 火山引擎 # # ChatGPT # MOSS # 互联网 # 安全 # 微软 # 文心一言 # 行业 # 通义千问

文章版权归作者所有，未经允许请勿转载。

如何使用Midjourney更改图片尺寸

lida

139

寻找一生伴侣，这7步，你做到了吗？

lida

176

Midjourney：仅11人，创造价值超1450万！

lida

189

ChatGPT引领金融新革命？聊天机器人或助投资者破解市场密码

lida

123

《【讯飞星火】打破ChatGPT壁垒，国内平替产品首推》

lida

220

对话火山引擎总裁谭待：从同质化的云服务中突围 | 数字思考者50人突然发生一阵眩晕，几秒钟就好了，是什么原因？医生告诉你真相

lida

105

No comments

No comments...

火山引擎入局大模型之战，却为何不走寻常路？

导语：

1. 火山引擎&大模型，另一种形态的爆发

2. 头部赛道的差异化打法

3. 多云多模型和1+N

结语：

火山引擎，要走大模型“军火商”的另一条路？

数据飞轮：点燃消费行业数字化fire

Related posts

No comments