21世纪经济报道 记者诸未静 上海报道
AI大模型技术应用爆发,云市场也在加速变革。
在4月18日的“原动力大会”上,火山引擎公司发布了一系列自研云产品,其中包括DPU(中央处理器分散处理单元)等先进技术。此外,该公司还推出了全新版机器学习平台,具备强大的训练能力,能够支持万卡级大模型的训练,同时实现微秒级的延迟网络,使得大模型的训练更加稳定、高效。这一创新性的技术升级,再次证明了火山引擎在云计算领域的领先地位。
在我国,有众多公司在大型人工智能模型领域崭露头角,其中大部分已经选择了火山引擎云作为他们的合作伙伴。火山引擎的总裁谭待表示,未来不会有哪一家公司能够独自垄断大型人工智能模型的市场。与其它云服务提供商强调自家的AI大模型不同,火山引擎计划与多家大模型展开深度合作,从而为企业和个人提供更加多元化的AI应用场景。
在会议上,火山引擎宣布与字节跳动在国内业务上达成合作。通过整合内外部的统一云原生基础架构,火山引擎可以为抖音等业务提供闲置计算资源的快速调度。此外,针对离线业务资源,可在分钟级别实现10万核CPU的调度;对于在线业务资源,可以实现潮汐式的复用。在弹性计算方面,抢占式实例的价格最高可享受80%以上的优惠。这一举措将有助于提高整个行业的计算效率,推动业务的发展。
在会议结束后,谭待强调了成本问题在云计算领域的关键地位。他强调,要想真正解决成本问题,必须采用技术手段来实现可持续性,而非依赖短期的商业策略,因为这种方法无法确保长期稳定。
让大模型训练快速跑起来
自2022年底发布以来,ChatGPT成为人类历史上最快获得上亿用户的消费级互联网应用。
许多我国科技公司在大型模型建设领域投入巨大,拥有出色的技术团队和深厚的行业背景以及创新思维,然而却常常在系统工程能力方面存在不足。为此,火山引擎应运而生,致力于为大模型客户提供稳定且高效的AI基础设施,从而满足他们在大规模场景实践中所需求的高性价比。
据报道,经过抖音等大量用户业务的长时间磨砺,火山引擎机器学习平台已经具备了支持单任务万卡级别的超大规模分布式并行训练场景的能力。该平台可以灵活调度GPU弹性计算实例,根据实际需求随时调用,最高能够帮助客户节省70%的算力成本。
杨震原,字节跳动副总裁,坚信业务创新离不开试错。他主张大胆且敏捷地尝试新事物,同时严格控制成本。火山引擎便运用潮汐、混部等策略,实现了资源的高利用率和极低成本。以抖音推荐系统为例,工程师仅用15个月的时间,通过对特定模型的样本训练,便能在短短5小时内完成训练,成本仅为5000元。而备受瞩目的抖音“AI绘画”特效,从启动到上线仅用了不到一周的时间,该模型由一名算法工程师成功训练。
MiniMax公司在国内AI领域独树一帜,成为少数成功研发大模型产品的技术创新者,具备文本、视觉、声音三大通用大模型引擎实力。据该公司联合创始人杨斌透露,MiniMax与火山引擎强强联手,共同打造超大规模实验平台,实现了千卡级常态化的训练规模;同时,其超大规模推理平台具备万卡级算力,可支持单日超过亿次的高调用量。在火山引擎的强大支持下,MiniMax的大模型业务得以迅速发展并取得重要突破。
向“多云多模型”架构演进
有评论称,大模型将成为云厂商弯道超车的机会。谭待对此表示,大模型还在发展初期,面临数据安全、内容安全、隐私保护、版权保护等许多问题需要努力解决。但可以预见,大模型将带动云上AI算力急剧增长,AI算力的工作负载与通用算力的差距会越来越小,这会为各家云厂商带来新的机会,同时也会对数据中心、软硬件栈、PaaS平台带来新的挑战。
以数据中心的算力结构为例,谭待表示:“大模型需要大算力,虚拟化会带来资源损耗,规模越大就损耗越多。未来3年内,大规模的算力中心,都将形成‘CPU+GPU+DPU’的混合算力结构,CPU负责通用计算,GPU负责AI计算,DPU负责资源卸载、加速和隔离,提升资源效率。”
此次原动力大会上,火山引擎发布了新一代自研DPU,实现计算、存储、网络的全组件卸载,释放更多资源给业务负载。火山引擎尽管是“最年轻”的云厂商,其自研DPU已达到业界领先水平,网络性能高达5000万pps转发能力、延迟低至20us。基于自研DPU的各类计算实例性能也有显著提升,例如适用于大模型分布式并行训练场景的GPU实例,相较上一代实例集群性能最高提升3倍以上。
他还表示,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。
“未来将是‘多云多模型’的时代。”他说。
更多内容请下载21财经APP
AI大模型, 火山引擎, 云市场, DPU
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!