ChatGPT引领的人工智能革命：量变引发质变

139 0 0

文章主题：人工智能, 自然语言处理, 大语言模型, ChatGPT

1. 本轮人工智能革命的起因和意义

本轮人工智能革命起源于微软旗下OpenAI发布的ChatGPT模型，它在自然语言处理领域取得了令人瞩目的成就。该模型的基础技术源自谷歌于2017年提出的Transformer算法，这一算法的核心理念在于为机器赋予充足的参数和自由度，并通过海量的数据进行强力训练，以期引发”涌现”（Emergent）效应，即通过量变催生质变。

Emergent 能力的三个示例：执行算术、参加大学水平考试和识别单词含义

资料来源：Emergent Abilities of Large Language Models ( 2022 )

语言，作为人类独特的交流工具，承载着我们的思想和情感，展现了我们抽象和概括的能力，因此，自然语言处理技术被视为”人工智能领域的璀璨明珠”。与其他人工智能模型不同，大型语言模型在对话中展现出类似人类的理解、推理、演绎和类比的能力，也就是我们所说的”思维链”。这种能力，曾经被看作是人类与机器学习的本质区别。通过”思维链”的推理能力，模型在提问时只需要添加一些提示，就能得出正确的结果，这完全展示了人工智能模型对人类高级思维能力的模仿，从而极大地扩展了人工智能的应用范围。就像iPhone使手机成为了一个可以随时使用的”人类器官”，并让互联网变得触手可及一样，ChatGPT作为一种调用计算能力和数据的最终方式，可能会使人工智能从完成特定任务的范畴扩展到几乎能替代或协助人类进行所有思考任务。正如黄仁勋所说，这就是人工智能的”iPhone时刻”。

自2017年Transformer架构被提出以来，ChatGPT背后的理论基础已逐渐成为业界共识。尽管如此，大型科技公司在投资数十亿级资金方面仍保持谨慎态度。然而，ChatGPT的出现改变了这一局面，使得业界认识到，只要能够充分挖掘海量数据的价值，通过训练大规模参数的模型，便可以取得显著的性能提升。这一观点在业内引发了关于大数据与人工智能之间关系的深入讨论，并推动了相关技术的发展。

在我国，人工智能大模型的长期发展一直较为缓慢，然而自从ChatGPT面世以来，短短数月时间便出现了多个与之匹敌甚至超越GPT-3的大型模型，这一现象不可谓不令人瞩目。

2. 算力、应用等环节的机遇与挑战

大模型对产业链的拉动主要体现在上游的算力环节和下游的应用环节。

在现代计算领域中，算力的提升关键在于模型的规模扩张。近年来，我们见证了大型语言模型（LLM）规模以每年十倍速度的增长。以BERT为例，2018年的它只有1亿个参数，而到了2020年，GPT-3已经达到了百亿参数的数量级。更令人震惊的是，2022年初发布的GPT-3.5已经上升到了惊人的1750亿参数（数据来源：《Large Language Models: A New Moores Law?》，Julien Simon，Hugging Face）。即便不考虑训练数据集的扩增，参数量的增加也极大地推动了训练算力的飞速发展。同时，随着各类应用以及大模型的广泛融合，推理阶段的算力需求有望迎来爆发性增长。根据TrendForce集邦咨询的预测，到2023年，AI服务器出货量将达到近120万台，同比增长38%。而在2022年至2026年期间，设备、AI服务器出货量的年复合增长率预计将达到22%，AI芯片出货量则有望在2023年实现46%的增长。

人工智能模型的算力需求呈现指数级增长

资料来源：Compute Trends Across Three Eras of Machine Learning ( 2022 )

AI 给逻辑芯片带来的增量测算

资料来源：上银基金权益投研部

在应用层面，人工智能可能带动传媒影视、游戏等行业的爆发式增长，同时也会促使机器人等新应用落地。

以机器人为例，执行一个看似简单的“拿薯片”指令，实际上却涉及到多个精心设计的计划步骤：首先，机器人需要走到抽屉旁边；接着，它需要打开距离最远的那个抽屉；然后，在众多薯片之中，它精准地挑选起绿色那一片；最后，将选中的薯片轻轻地放置在柜台上。对于传统机器人来说，完成这样的复杂任务面临两大挑战：一是难以精确控制手臂和手指的动作，二是处理多种信息并做出恰当的决策。

首先，传统机器人的操作流程通常从工程师开始，需要不断编写新代码和规则来纠正机器人的行为。这个过程缓慢、昂贵且低效，需要多次交互才能使机器人正常运行。

其次，机器人通常在明确具体任务和奖励的情况下表现最好，但在学习执行多步骤任务和推理抽象、模棱两可的指令方面存在困难。

然而，以 ChatGPT 为代表的大模型开启了一种新的机器人范式。一方面，大模型允许非技术用户参与控制回路，可以直接为机器人场景生成代码，在没有任何微调的情况下，利用大模型的知识来控制不同的机器人动作，以完成各种任务。另一方面，大模型也能够理解微妙的语句，例如 ” 我刚刚锻炼过，可以给我拿一份健康的零食吗？”

类似的人工智能技术也有望在传媒影视、游戏等领域带来爆发式增长，比如通过大模型的智能和创造力，实现更出色的艺术创作。

大模型的出现改善了机器人对环境的适应性

资料来源：微软

然而，大模型的落地也面临一些挑战。

首先，大模型对计算资源的要求很高，需要大规模的计算设备和存储空间，这对企业和组织的投入提出了挑战。

其次，大模型的训练和部署需要处理大规模的数据集，而数据的质量和隐私问题也是需要考虑的重要因素。此外，大模型的复杂性也增加了模型可解释性的难度，这在某些领域，如法律和医疗等敏感应用中尤为重要。

总的来说，上银基金认为，算力和应用环节在大模型发展中具有重要地位。算力需求的增长将推动硬件产业的发展，并催生出更多高性能的 AI 服务器和芯片。同时，大模型的广泛应用将为各行各业带来创新和突破，但也需要应对算力、数据、模型解释性等方面的挑战，以实现大模型技术的可持续发展和应用的成功。

3. 国内人工智能相关投资机会的展望

从投资角度来看，上银基金指出，算力板块直接受益于产业趋势，随着海量数据的收集、清洗、计算、训练和传输需求的增长，将带来算力和网络的迭代升级，利好 AI 数据中心和边缘高速计算所使用的 GPU、CPU、FPGA、ASIC、HBM 存储器、3D NAND、光芯片等。国外 GPU 的严重缺货，以及供应链的多元化需求也为国产 AI 芯片、服务器带来了适配机会。大模型的发展阶段是黄金窗口期，国内的算力芯片厂商具备良好的入局机会，相关的龙头企业有望明显受益。

此前，由于商业模式的缺陷，传媒影视、游戏和互联网软件等应用板块的估值普遍较低。因此，上银基金表示，AI 应用行情的核心逻辑是用 AI 改造传统的商业模式，实现业绩与估值的戴维斯双击：需求端通过 AI 赋能提升用户体验，带来渗透率 / 斜率加快，供给端降本增效，释放更多产能，业务结构端提升软件算法平台权重，提升估值。当前，应用板块的估值修复基本完成，行情将进入逻辑驱动和业务驱动的第二阶段。在这个阶段，投资者应重点考虑业务的可持续性以及人工智能使用成本与客户需求的匹配度。

尽管目前人工智能仍处于产业趋势形成阶段，大模型和应用的格局不易判断，受事件催化影响较大，但该阶段正是成长股投资的最佳阶段，格局清晰后有望进入成长股的 ” 价值投资 ” 阶段，因此，上银基金认为，可以密切关注算力上游芯片放量以及下游 AI 服务器客户需求情况，并关注应用领域的真实客户需求；同时，投资者可以对机器人等具有现象级潜力的产品的落地保持期待，并结合行业发展动态理性投资决策。

〖证券之星资讯〗

本文不构成投资建议，股市有风险，投资需谨慎。