烧钱才刚刚开始。
作者:张轶骁
来源:凤凰WEEKLY财经(ID:fhzkzk)
“大模型”开始扎堆了。
从百度文心一言上线开始算起,一个多月时间内,国内版“大模型”争先恐后,鱼贯而出。
🎉🚀随着各大科技巨头如阿里巴巴和商汤纷纷推出先进的人工智能模型,比如盘古大模,华为也展现出其强大的技术实力,让人眼前一亮。而市场上,模仿ChatGPT热度的产品更是犹如雨后春笋般涌现,ChatGPT的影响力可见一斑。📚🔍这些创新的AI产品不仅丰富了市场选择,也为未来的科技发展带来了无尽可能。如果你想了解更多这样的热门动态,不妨探索一下,让技术引领我们的未来!✨
最新的消息是科大讯飞,5月6日,科大讯飞将正式发布讯飞星火大模型。
阿里巴巴集团董事会主席兼CEO张勇的一句话,或许道出了如今大模型大热的原因:所有产品都值得用大模型重做一遍。
🚀曾经的互联网狂飙,仿佛把世界带回到了一个万物皆可共用的时代。从自行车到马扎,从日常用品到应急工具,所有熟悉的物件,在互联网的翅膀下摇身一变,成为共享单车、共享马扎、共享雨伞和充电宝——创新的共享经济浪潮席卷而来。🔥然而,这股热潮并非永恒,激烈的市场竞争如同无情的熔炉,淘汰了不适应者,只留下少数佼佼者。💻如今,这些曾经的热门词汇,虽然已淡出大众视野,但它们所代表的理念与价值,依然在我们的生活中烙印着深深的印记。🌍
如今这一幕,或将又在大模型热中重现。
01
大模型,让大厂再度“跑起来”
百度文心一言之前,独领大模型风骚的是ChatGPT,国内公众只有羡慕嫉妒恨的份儿。
文心一言出来后,国内对大模型的讨论、对比、褒贬才显得真切并言之有物起来。
🎉🚀【智能新星崛起】🔍——百度文心一言的背后力量🔥面对一些质疑声,或许你还在疑惑百度文心一言的言论是否精准无误。但这并不妨碍众多科技领域的专业人士对其潜在的巨大价值深感震撼。他们眼中的,不仅仅是一个功能尚不完善的尝试,而是大模型技术引领下的智能新星🌟。尽管初期难免存在不足,但正是这些“胡说八道”的问题,暴露了其学习和进步的空间。背后的大数据与算法,正在以惊人的速度优化着,为用户提供更贴近需求的智慧输出🔍。对于搜索引擎优化而言,这样的产品无疑具有极高的潜力。通过深度学习,文心一言正逐步提升自身的语言理解和生成能力,这不仅利于用户,也为其在SEO领域的地位奠定了坚实基础。\ufe0f未来,百度文心一言有望成为智能交互的新里程碑,让我们拭目以待它如何用科技的力量,打破常规,引领潮流!🚀
大模型的全称是“预训练通用大模型”,这是一个与“小模型”或“垂直大模型”相对的概念。
早期的人工智能是针对特殊应用场景进行的训练,例如,翻译功能只能用于翻译,画图功能只能用于画图,两者之间并不联通。
🌟💡 大规模模型革新背后,是海量数据驱动的深度学习,构建了通用性强、实用价值高的基础体系。🔥只需对应用场景稍加定制,就能让AI展现出强大的适应力,实现快速且高效的微调。🌍这不仅提升了人工智能的整体效能,也为未来的创新打开了无限可能。🌐
🌟💡大模型,烹饪界的创新者!🔥✨它以无尽的数据为原料,匠心独运地将它们融合成多功能的“食材宝箱”。🌍🍽只需轻轻一取,适应各类口味的食材就准备齐全。然后,根据客人的特别需求,简单几步,美味佳肴瞬间出炉!👩🍳🍲每个“食材包”都蕴含着科技与艺术的完美结合,旨在提供最便捷、个性化的烹饪体验。🌍🎉不论是忙碌的工作日,还是轻松的家庭时光,大模型都是你的得力助手,让餐桌上的每一餐都充满惊喜和满足!👨🍳👩👧告别繁琐步骤,拥抱高效厨房生活,让大模型带你开启美食新时代!🌟🎊
🌟ChatGPT风靡全球之际,百度以其强大的大模型实力,展现出独特的优势。🚀他们正快速行动,以大模型为引擎,打造一系列创新应用,直面ChatGPT的挑战。📚这些应用不仅深度融入搜索引擎,更将广泛服务于各领域用户,提供全方位解决方案。🌐通过智能化技术,百度引领行业潮流,为用户提供卓越体验。🌟SEO优化:#百度大模型# #技术创新# #搜索应用
除了文心一言之外,百度方面还透露,文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域。
华为的《预训练大模型白皮书》曾经这样描述预训练大模型的意义,在下一个划时代的计算模型出现之前,预训练大模型将是人工智能领域最有效的通用范式,并将产生巨大的商业价值。
而且,相比于普通开发者从头搭建的算法,其精度明显上升,数据和计算成本明显下降,且开发难度大大降低。以计算机视觉模型为例,其开发成本只相当于原来的10%甚至1%。
这样的机会,没有哪个大厂愿意错过。
继3月16日百度文心一言发布后,阿里和商汤分别于4月7日和4月10日发布了类ChatGPT产品“通义千问”和“商量SenseChat”,其背后对应的分别是阿里的通义大模型和商汤的日日新SenseNova大模型。
根据民生证券研报统计,目前国内至少已经有30多家大模型亮相,其中不乏参数规模甚至超过ChatGPT规模的大模型。厂商涵盖了互联网巨头、AI上市公司、服务器龙头企业、科研院所与一级市场创业公司。
还有一个动力,来自于大厂自身。
经历了增速放缓、向内要利润带来的“阵痛”之后,大模型可能是互联网大厂的下一个,也是唯一一个能恢复“狂飙”状态的新领域。
过去一年,伴随着种种原因,大厂们都忙着做减法,不赚钱的业务果断关停,没有前景的项目果断砍掉,给内部试错的机会和时间都越来越少。
这与大厂此前的态度截然不同,对互联网企业来说,只要业务本身健康、赚钱,有毛利,能继续用投入换来商业模式的升级、人员结构的稳定和新的业务产出,净利方面,亏点钱算不得什么。
但一旦大厂进入“要利润”的阶段,同步带来的就是放慢脚步,降本增效,裁员和“毕业”的戏码就会时常上演。
大模型的出现,显然是给大厂指了一条向前“狂飙”的新赛道,既有商业价值,又有成长空间,唯一差的就是投入。
而对互联网大厂来说,只要能看到出路,能讲出故事,以大厂的名头,不愁没钱可烧。
02
大模型+全行业
如今的人工智能,刚刚通过OpenAI与ChatGPT看到了商业化的曙光。
除了文心一言应用于搜索之外,阿里的通义千问将目光聚焦在了协同办公。在为数不多的C端应用场景中,搜索、办公这些偏向标准化的场景,是人工智能大模型和人工智能应用最好的用武之地。
4月7日,通义千问的发布会上,阿里已经将钉钉当作了人工智能应用的重要场景。例如,钉钉接入通义千问之后,可以在文档中创作诗歌,撰写邮件、方案等。在会议中,可以生成会议记录,总结会议纪要等。在群聊中,可以自动总结群聊信息中的要点等。
这与微软有着相似之处。
就在3月17日,微软已基于ChatGPT,为Office开发出了名叫Copilot的新功能。官网介绍称,在Word中,Copilot能为用户提供初稿以供编辑,能节省写作、找资源和编辑的时间。在PPT中,可以帮助用户通过简单的提示创建演示文稿。在Excel中,可以帮助用户分析数据。
透过ChatGPT生长的土壤,大模型更像是一个超级的App,或者是一个超级底座。
在这个底座基础上,各家科技企业将自己所掌握的人工智能技术,与各行各业的需求结合,训练、生成自己的应用和服务,并通过应用和服务获取收益。
通过这种过程,原则上来说,只要有细分领域数据,大模型就可以针对垂直领域做优化,赋能各行各业。
这意味着,与ChatGPT、文心一言、通义千问等常见的C端应用不同的是,大模型的真正用武之地和赚钱之道,来自于B端。这是互联网“人口红利”增长见顶的当下,大厂们最需要抓住的领域。
商汤科技联合创始人、首席科学家王晓刚在大模型发布活动上表示,商汤版的GPT主要面向企业端(B2B)业务。此外,商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,而且商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。
华为也是如此,华为盘古大模型早在2021年就已经发布,时至今日,华为并未追随文心一言、通义千问等推出偏向C端的应用。
相对而言,华为云AI已经在各行业有超过1000个项目,迄今为止基于盘古大模型,陆续推出了矿山、制药、气象、海浪等大模型。
例如,矿山大模型作为行业类的预训练模型,可以基于采矿业的数据、地质情况,迅速学习矿业知识,进而生成针对不同矿藏的应用,解决井下采矿的智能化、自动化问题。而海浪大模型,则可以根据海洋数据,在渔业等海洋相关的行业内应用,减少人工海上作业的风险。
国金证券研报认为,华为的盘古大模型具备“一个模型在众多场景通用、可泛化和规模化复制”的特点,让AI开发模式由作坊式向工业化转变。
对大厂们来说,一个天然的优势是,大厂自身就通过投资或实际经营涉足了诸多行业,本着“肥水不流外人田”的原则,大厂的自身业务,既可以成为最先享受到人工智能赋能的领域,也是大模型最好的“试金石”。
李彦宏曾经介绍,百度计划将多项主流业务与文心一言整合,涉足的业务包括搜索、百度智能云、Apollo智能舱,以及小度。
张勇也表示,阿里巴巴所有产品,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等,未来都将接入“通义千问”大模型进行改造。
03烧钱的战事,才刚刚开始
大模型之争,才开了个头,大戏还在后头。
华为《预训练大模型白皮书》中指出,通过大模型构筑AI技术竞争壁垒,是当前中美AI技术竞争的热点。
围绕大模型的竞争,不外乎两个因素:财力和算力。
毋庸置疑,大模型是一项极为烧钱的事物。
《财经十一人》援引多位技术人士的观点总结称,大模型的投入成本包括,一个智算集群的建设成本约30亿元,一次完整的模型训练成本少则千万元,多则上亿元。这还没算数据采集、网络带宽、电费等成本,也有数亿元的开销。
此前有消息称,微软仅仅是在ChatGPT-3的训练中,就投入了1200万美元。而OpenAI在过去一年中烧掉了5亿美元。
以微软过去一年727.38亿美元的净利润来透视,这笔投入尚在能负担得起的范畴。而放到国内,既有资金实力,又有云业务作为基础的企业,也就是华为、百度、阿里、腾讯等少数几家头部互联网大厂。至于现在才刚刚开始投入大模型的创业者,能扛到最后的概率更是非常渺小的。
除了钱之外,算力方面,中国也处在“卡脖子”的阶段。代表着算力最高性能的英伟达A100和H100芯片被限制向中国出售,能够获得的最佳替代品A800也处在供不应求的状态。
这样的劣势,会带来AI大模型训练的准确度和反应速度都不足。反映到具体的应用中,就体现为文心一言、通义千问的“智商”远低于ChatGPT。
财力和算力都不占优,中国企业唯一可能有所作为的,是数据。这也是每一家大厂的看家宝贝。
伴随着“所有产品都值得用大模型重做一遍”的口号,另一个可能出现的现象是“所有的数据壁垒也都会在大模型上重建一遍”。
很多人或许还能想起,互联网巨头们画地为牢,搭建起一个个生态孤岛的时代。微信无法分享淘宝链接,淘宝也不能使用微信支付,用户、数据、基础设施和信息的自由流动都因此割裂开来。
如今,互联互通的时代早已来临,但大模型之于当今各行各业的意义,仍然与早年间支付宝、微信的意义相差无几。对于拥有大量数据的互联网大厂来说,无外乎两条路,要么下场砸钱,做出属于自己的通用大模型,或至少是针对细分领域的垂直大模型;要么乖乖将自己的数据捧到别家大模型的手里。
国盛证券研报认为,即使大模型已经拥有强大智能,但可能缺乏特定场景的知识,也需要结合具体场景的需求,因此在落地时依然需要场景数据进行微调。
换句话说,有了大模型,就有了吸取各行各业数据的入口,也会在智能化水平、赋能水平上形成自己的护城河,高出其他没有大模型的厂商一头。
因此,才有了脉脉创始人林凡爆料称,“ChatGPT带动的AIGC创业热潮要来了,猎头已经开出10万月薪抢人。”以及,不少人工智能企业都释放出岗位,争抢最顶级的算法工程师。
但更重要的是,从国内的视野来看,大模型的商业化落地尽管有了部分进展,例如华为依托盘古大模型训练出来的矿山大模型已经在山东的能源企业得到应用,但总体而言,大模型的商业化落地并不稳定,不足以拿出去给外人看。更多的企业还是在像百度文心一言上线初期一样,处在疯狂“摇人”测试性能的阶段。
有业内人士认为,这种疯狂的创立大模型,训练大模型的窗口期不会太长,最多半年到一年,就会有出局者诞生。但大模型真正带来稳定的商业化落地,改变各行各业,形成新的生态,为互联网企业带来稳定的收益,还需要更长的时间。
由此看来,烧钱的战事,才刚刚开始。
*免责声明:本文章为作者独立观点,不代表创业家立场。
让创业者不再孤独
成为产业新力量黑马营26期重磅开启
(扫描下图二维码,即刻加入)
更多精彩内容,尽在创业家视频号
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!