国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

AI与情感2yrs ago (2024)update lida

173 0 0

文章主题：ChatGPT, 大模型, AI竞争

666ChatGPT办公新姿势，助力做AI时代先行者！

AI大模型创业将是一场持久战。

打开凤凰新闻，查看更多高清图片

作者 | 李水青

编辑 | 心缘

随着ChatGPT火遍全球，“千模大战”在国内已经打响！

今年春季，国产大模型的发展进入了高潮，被赞誉为”春天的到来”。据统计，自2022年11月ChatGPT发布以来，至5月29日，国内涌现了不下55款创新的类GPT模型，蓄势待发。从互联网巨头到AI初创企业，再到行业领头羊、高校和研究机构，乃至大数据和计算能力供应商，都纷纷加入了这场AI技术的激荡盛宴。这场AI“大混战”不仅展示了中国在人工智能领域的迅速崛起，也预示着未来AI技术的广泛应用与深化。

🏆国内类GPT大模型动态一览🌟🔍聚焦企业前沿动态，以下是国内外顶尖AI力量近期发布的重量级大模型更新概览：1. 百度🔥：引领创新，文心一言于今年崭露头角，展现强大语言处理能力。2. 阿里🌈：通义千问紧随其后，持续迭代升级，为用户提供更智能的服务。3. 华为🌟：盘古大模型虽未近期更新，但2021年已初显实力，未来潜力不容小觑。请注意，此类技术竞赛中，企业动态瞬息万变。如需获取最新进展，建议关注官方声明或查阅行业权威报告。🚀SEO优化提示：- 类GPT- 大模型发布- 百度、阿里、华为- 语言处理能力- 智能服务- 盘古大模型- 行业动态- SEO优化关键词：国内类GPT、AI大模型、百度文心一言、通义千问、华为盘古、技术更新

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

国内大模型推出与更新时间表（2022年11月~2023年5月）

📚✨最新研究揭示！2023中关村论坛上的《中国AI大模型地图》震撼发布——全国14省份聚焦大模型创新🔥💡，其中京穗两地引领风骚，北京独占鳌头，拥有38款卓越产品；广东紧随其后，展现出20款强大实力。这份报告不仅展示了全国人工智能研发的广度与深度，更揭示了隐藏在数据背后的技术繁荣。🌍🌐每一个数字背后，都是中国AI技术的崛起和全球影响力日益增强的有力证据。🏆🌍欲了解更多详情，敬请关注相关行业动态或搜索”2023中关村论坛 AI 大模型地图”，获取专业且权威的信息。📚SEO优化提示：关键词如”人工智能大模型地图”、”中关村论坛”、”中国AI研发”等将有助于提升文章在搜索引擎中的排名。记得分享给对科技感兴趣的朋友们哦！🤝

国产大模型浩浩荡荡，但这还没算上陆续官宣创业的业界大佬动作，今年2月起，从美团联合创始人王慧文到搜狗创始人王小川，再到李开复宣布Project AI 2.0计划……大佬“从大厂毕业去做AI”成为科技圈的新趋势。

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

国内部分知名人士大模型创业情况（不完全统计）

🌟预测未来：IDC巨头揭示中国AI市场狂飙突进之路！🚀🔥2023年，全球瞩目的ICT市场趋势论坛上，IDC震撼发布：中国AI领域的繁荣将引领世界潮流，预计在短短三年内，规模将从147亿美元的起点一路飙升至惊人的263亿美元！🚀🔍增长引擎：基于大模型的革新力量，AI应用、生成式AI和新兴企业崛起，成为市场增量的关键推手。没有大模型实力，就像船只失去了舵，厂商们正面临严峻挑战。🌊👀这场技术盛宴，对国内互联网巨头与AI领军者来说，既是机遇也是压力，他们必须加速创新，以应对这股势不可挡的浪潮。🏆SEO优化提示：使用行业术语如”大模型AI”、”市场增量”、”新兴企业应用”等，增加关键词密度，同时保持内容连贯性和信息准确性。

实际上，国内大模型于2021年前后就崭露头角。三年来，国内企业推出的大模型参数规模从几十亿扩展到几万亿；同时，通用大模型也在向行业大模型发展，应用从Demo进化为测试版本，已有一定技术和产业基础。

ChatGPT的出现，无疑揭示了国内外技术间显著的代际鸿沟。尽管百度文心一言备受期待，但其创新力却遭创始人直指，得分为70分，这引发了业界对本土大模型追赶速度的关注。国内大模型在中文领域及某些特定细分行业或许能展现出短期优势，但这并不意味着可以高枕无忧。未来，如何缩小差距、实现弯道超车，将是国内玩家需要深入思考和努力的方向。🚀

🌟🚀技术新纪元：ChatGPT挑战下的全球大模型风云🔥🔍在全球逆全球化趋势的浪潮中，创新与技术的较量成为热议焦点——众多期待国内涌现能与ChatGPT一较高下的技术巨头。这场人工智能领域的“激战”，究竟隐藏着哪些相似与差异？是实力硬核的真刀实枪对决，还是表面华丽的虚晃一招？它们的发展前景如何？未来的竞争格局又将如何演变？本文深入剖析，带你揭示这场科技盛宴背后的真相！🚀🏆

01.互联网云大厂围攻ChatGPT，军备赛打响

近几个月，随着微软、谷歌、亚马逊等硅谷大厂纷纷公布大模型及AIGC进展，通过AI搜索引擎、AI办公软件等一系列应用打响AI竞赛，国内互联网云大厂也陆续全军出击了。

以百度、阿里、腾讯、华为为第一梯队玩家，360、京东、网易、知乎等为第二梯队玩家，以及字节跳动、快手、小红书等为潜力玩家，互联网/云大厂已经在大模型、算力设施、AIGC应用产品、生态等各方面展开了明争暗斗。

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

互联网、云大厂推出大模型的情况

众所周知，打响应战ChatGPT第一枪的互联网大厂是百度，今年3月面世的文心一言（ERNIE Bot）是百度在2021年12月推出的百度·文心（ERNIE 3.0 Titan）迭代而来的细分模型，百度创始人李彦宏称将用其重构百度所有的应用。而后，首个跳出来硬刚百度的是阿里。4月11日，阿里云推出通义千问大语言模型（LLM），阿里董事会主席兼CEO张勇宣布，阿里所有产品将接入大模型全面升级。阿里的大模型进展公开可追溯到2021年10月的云栖大会。

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

阿里云推出通义千问大语言模型（LLM）

随着百度、阿里参战，互联网云大厂AI竞赛开始变得硝烟四起。

4月9日，360集团基于360GPT大模型的“360智脑”落地搜索场景内测；

同日，京东透露京东言犀大模型预训练参数达到千亿级，2月言犀平台曾官宣推出“产业版ChatGPT”：ChatJD；

4月13日，知乎和面壁科技合作推出中文大模型“知海图AI”，落地“热榜摘要”开启内测；

近日，短视频厂商字节跳动、快手，以及生活方式平台小红书都已筹备大模型团队或透露出大模型计划。

……

华为和腾讯仍未在这波大模型浪潮正式推新，但已经从局部领域围而攻之。

比如，华为于2021年4月就推出了盘古系列大模型，并在2022年推出了矿山、气象、金融OCR等行业大模型。4月17日，华为云旗下的智能编程助手CodeArts Snap在深圳一场“华为代码大模型的方案与应用”活动中露面；再看看腾讯这边，其也在2022年12月推出了万亿参数的中文NLP预训练模型“混元”（HunYuan-NLP-1T），但至今未正式披露类ChatGPT应用的新进展。4月14日，腾讯云推出大模型算力集群；5月15日，腾讯云副总裁、腾讯云智能平台负责人李学朝透露：“具体的大模型腾讯内部正在做……具体进度后续会统一对外公布。”

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

华为云AI领域首席科学家田奇4月讲解盘古大模型

当然，仍有一些互联网大厂表现得比较谨慎。比如搜狐董事局主席兼CEO张朝阳近日接受媒体采访时称，搜狐现在对大模型仍是观望，应该会从应用角度来看一看，相对还是比较谨慎一点，但在整个GPT的应用方面搜狐已经开始在产品里逐渐渗透了。

通用大模型之战是大厂的大型军备竞赛。

市面上大厂推出的大模型，大多是基于Transformer架构进行开发的通用大模型，这是一场算法、算力和数据以及应用落地、生态合作的全面比拼。这边，百度刚刚宣布文心一言接入企业超700家；那边，阿里云宣布全系产品史上最大规模降价，发起规模战进行攻击；看似按兵不动的华为则加速在行业“圈地”，抢占大模型落地先机。

合作成为BATH以外的互联网企业的选择。比如360集团和知名AI大模型企业智谱AI于5月宣布了战略合作，共同研发千亿级大模型“360GLM”，借鉴“微软 OpenAI”组合的分工模式。5月24日，云知声也宣布了与360集团的战略合作，双方将积极推动山海大模型在各领域的落地应用。

在打法上，互联网云大厂大多“两条腿走路”：一边通过提供大模型MaaS，获取平台服务费用；一边通过出租算力和推训平台，赚取大模型企业的租金。两种方式都有望成为云服务业务的新增长点，并带来新的云服务范式。

尽管战争仍在初期，大厂之间已经开始明着较量，阵势不小。

02.AI企业大乱斗：数量多爆发强，避开“巨兽的脚印”抢生存空间

AI大模型也吸引了一大批创业者，从美团联合创始人王慧文到搜狗创始人王小川，再到李开复宣布Project AI 2.0计划，众多大佬都在加入AIGC创业潮。

实际上，国内已有一批AI企业率先将大模型做出来了。

据智东西统计，国内至少有19家AI企业加入了这场AI大模型之战，其中4月官宣的企业达到9家，接近一半。如下图所示，这些AI企业大致分为两类，一类是专用AI中小模型起家的企业，一般成立有一段时间了；一类是原生AI大模型创企，大多是新公司。

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

AI企业推出的大模型

在第一类AI企业中，最受关注的无疑是NLP领域龙头企业科大讯飞，其于5月6日推出的“星火”大模型已开启内测，与文心一言打擂台。

此外还有商汤科技，其于4月10日推出“日日新SenseNova”大模型体系，包括其自研中文语言大模型应用平台“商量”等。近期，包括云从科技、云知声、旷视科技等专用AI起家的知名企业都披露了大模型动向。这类企业具有AI算法研究的人才队伍及经验积累，长处在于算法研发和行业工程化突破。

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

商汤科技推出日日新大模型

第二类企业是AI大模型原生企业，如昆仑万维，其在4月10日正式推出千亿级大语言模型“天工3.5”，对标ChatGPT、支持万字以上的文本对话。有很多AI大模型企业创立不久，比如创立于2021年的澜舟科技、MiniMax等，但其团队成员做大模型的时间却跨越数年。这波大模型浪潮的到来令这些企业压力不小，催促其加快结合细分赛道的产业化探索。

可以看到，在这些大模型的领域分布上，NLP仍是目前大模型研发最为活跃的重点领域，其次是多模态领域，在CV和智能语音等领域的大模型还较少。

AIGC大模型已成为热门投资领域，金沙江创投管理合伙人朱啸虎近日发文透露今年的投资策略，称今年一半投资都给了AIGC。反过来对于AI公司来说，推出大模型有望帮公司吸引更多资金以推动估值上涨，比如刚刚推出AI大语言模型“序列猴子”的出门问问，就被彭博社爆料正推动港股IPO，可能筹集约2亿至3亿美元。

在互联网大厂的团战之下，AI创企的空间有多大？

对此多位业内人士和投资人告诉智东西，AI大模型领域不同于互联网“大补贴”时代，可能不会赢家通吃，而是百花齐放。

一方面，大语言模型在产业可能仍是大厂主导，因为参赛入场券是足够的钱、数据、算力及人才。比如OpenAI三年前接受了微软为其打造的一台由数万个A100 GPU组成、价值数亿美元的大型AI超级计算机，据推测标准大小的ChatGPT-175B大概需要625台8卡DGX A100服务器进行训练，成本约达到3~5亿元人民币。创企融来的几亿元在这个层面几乎做不了什么，大厂则资金相对充裕。

但另一方面，有业内人士告诉智东西，一些关键点突破可能还要看科创公司。据悉，国内AI企业的大模型很多是基于GPT-2开源模型开发而来，与GPT-4仍有代际差。由于GPT-4是闭源的，国内企业无法参考论文而只能自行研发追赶，并不是投钱和时间就能攻克的。因此从算法层面来说，AI创企与互联网大厂可以说站在同一起跑线，甚至聚焦创新的能力会更强。

正因为AI大模型算法结构突破难度大，许多创企公司都是由高校及科研机构成果孵化而来。与此同时，众多高校直接推出了大模型，包括复旦大学、清华大学、武汉大学等。

根据《中国人工智能大模型地图研究报告》，大模型的学术影响力已初步形成，但仍有提升空间。在开源影响力方面，国内大模型研发团队在积极推进大模型开源发展，目前已经有超过半数大模型实现开源，且高校和科研机构是开源主力。

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

高校及科研机构布局大模型的情况

即便是基于强大科研成果，AI初创企业要突围还需要花些巧劲。正如创世伙伴资本合伙人梁宇此前告诉智东西：“创企要学会躲开‘巨兽踩下的脚印’，所有伟大的公司都是从很小的缝隙中钻出来的。”

在大厂领跑的同时，初创公司的机会可能在应用层，从垂直领域切入做产业落地、降本增效。比如澜舟科技聚焦的就是金融领域。其于3月14日推出孟子对话大模型，而早在2021年7月推出了孟子（MChat）大模型及相关系列开源模型。基于Transformer，孟子大模型可支持以及快速替换自回归（如GPT）、自编码（如BERT）等多种预训练模型。

03.行业公司与算力企业纷纷入局，抢占绝佳站位

说到AI大模型竞赛，数据是必不可少的一环。行业公司掌握海量数据，是这波“千模大战”中另一类不容小觑的选手。

据智东西统计，截至目前至少有15家行业公司推出了行业大模型。其中，金融领域涉及的企业最多，包括中国农业银行、江苏银行、度小满、奇富科技等；教育领域涉及的企业仅此其后，包括网易有道、学而思、淘云科技、孩子王等推出或计划推出大模型。此外，医疗、自动驾驶、智能物联等领域的行业公司都已经行动。

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

行业公司推出的大模型

随着大模型产业化落地加速推进，目测一大批来自各个行业的大模型也将喷涌而出。

行业头部公司由于接近客户和落地场景，因此更容易在数据、应用落地方面占据优势。比如近日，度小满正式开源国内首个千亿级中文金融大模型——“轩辕”。轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来，在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上，效果相较于通用大模型大幅提升。

说到数据，实际上也有一些大数据起家的公司推出了大模型。比如大数据公司达观数据就于3月18日推出了曹植大模型，不过具体参数和应用效果还不清楚。

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

大数据公司推出的大模型

此外，一些算力公司也推出了大模型。比如4月29日消息，联发科在4月28日发表官方博客称，联发科AI研究小组近日发布了全球第一个繁体中文大型语言模型BLOOM-zh。多语言模型BLOOM-zh在保持其英语功能的同时，在大多数繁体中文基准上优于其前身。

国内服务器头部企业浪潮甚至在2021年9月就推出了源1.0大模型。根据公司2月在深交所互动平台上的发言，源1.0模型结构与GPT-3类似，与GPT-3相比参数量增加40%，训练数据集提升10倍，达到了2457亿参数，训练使用了5TB的高质量中文数据。消息称，源2.0也将在不久之后发布。

国家超算天津中心于5月19日推出了“天河E级智能计算开放创新平台”和“天河天元大模型”，据称将带来突破百亿次的跨模态的超级计算算力，支撑传统的科学工程计算，并服务智能混合计算，成为智算中心机构布局大模型的代表。

可以看到，行业、大数据、算力领域的大模型入局玩家还不多。但由于这些领域的企业往往拥有算力和算力优势，如果与AI大模型企业合作，有望在大模型领域实现超车，这都为“千模大战”的战况带来更多变数。

04.千模大战打响，研发和落地是持久战

仅仅两个月时间，国内的大模型之战已经打响，互联网/云服务大厂、AI企业、行业公司、大数据公司以及算法公司全都入局了。

可以看到，入局的公司要么在资本实力、平台生态、应用场景方面占据优势，要么在算法、算力和数据层面构筑了护城河，但这都只是一张“入场券”。

AI大模型创业将是一场持久战。国内的大模型产品大多与GPT-4仍有代际差，这毕竟是一个高难度的系统性工程，仍需要国内大模型玩家深耕技术、贴合应用，以此在硅谷巨头的包围中实现突破。

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！

# AI与情感 # # 医疗 # 教育 # 软件 # AIGC # ChatGPT # ChatJD # ICT # 互联网 # 京东 # 医疗 # 商汤 # 天工 # 媒体 # 学会 # 微软 # 教育 # 数据分析 # 文心一言 # 日日新 # 昆仑万维 # 星火 # 机遇 # 清华大学 # 盘古 # 管理 # 行业 # 软件 # 通义千问 # 金融

文章版权归作者所有，未经允许请勿转载。

Midjourney5.2版本：强大新功能的震撼展示

lida

165

ChatGPT热潮下，科技与人心的探讨——一窥全貌的哲学书单

lida

167

张三行为：罗翔老师谈法治思维

lida

102

科大讯飞：引领国产大模型生态，助力各行业智能化发展

lida

129

AI伴侣：未来感情的终极大？

lida

155

人工智能与灵魂：意识的界限何在？

lida

122

No comments

No comments...

国内大模型激战开启，ChatGPT引发‘千模大战’背后的秘密与未来格局探讨

iOS版ChatGPT爆火！一周下载量超50万，OpenAl引领聊天机器人新潮流?

对教育和人类福祉，ChatGPT是一种威胁还是一份礼物？

Related posts

No comments