文章主题:人工智能, 自然语言处理, 大语言模型, ChatGPT
1.本轮人工智能革命的起因和意义
本轮人工智能革命的起点可以追溯到微软旗下的OpenAI发布的ChatGPT模型,它在自然语言处理领域表现出了惊人的能力。这个模型的基础技术源自谷歌在2017年提出的Transformer算法,这一算法的核心理念是赋予机器充足的参数和自由度,并结合海量的数据进行强力的训练,以此来达成”涌现(Emergent)”效应,即通过量的积累引发质的飞跃。
Emergent 能力的三个示例:执行算术、参加大学水平考试和识别单词含义
作为一篇具备专业水准的文章,我会从多元化的资料来源中获取信息,并确保对相关主题有深入的了解。在这篇文章中,我引用了《Emergent Abilities of Large Language Models (2022)》这本书作为主要参考资料。
语言,作为人类独特的交流工具,承载着思想和情感的表达,展现了人类在抽象和概括方面的卓越能力。因此,自然语言处理技术被赞誉为“人工智能领域的璀璨明珠”。不同于传统的人工智能模型,大型语言模型在对话过程中展现出类似于人类的理解、推理、演绎和类比的能力,也就是我们所说的“思维链”。过去,这种能力被认为是人类与机器学习之间的本质差异。得益于“思维链”的推理能力,模型在提问时仅需添加提示,便可得出准确的答案。这充分显示了人工智能模型对人类高级思维能力的模拟,从而极大地推动了人工智能应用的发展。就如同iPhone将手机转变为“人类器官”,并使互联网变得触手可及一样,ChatGPT作为一种调用计算能力和数据的最终方式,可能推动人工智能从执行特定任务的范畴扩展到几乎能替代或协助人类进行所有思考任务。正如黄仁勋所言,这是一个人工智能的“iPhone时刻”。
自2017年ChatGPT背后的Transformer架构被提出以来,理论上其已经具备了显著的提升性能的能力。然而,即使面对这一革命性的技术变革,各大巨头依然保持着相对保守的态度,对于大规模投资仍然持有观望态度。直到ChatGPT的出现,才促使整个行业达成了一个共同的认知:只要能够通过海量的数据来训练出参数足够大的模型,就能够实现令人瞩目的性能飞跃。这也意味着,Transformer架构的价值得到了广泛认可,成为了深度学习领域的一大突破。
在我国,人工智能大型模型的长期发展一直较为缓慢。然而,自从ChatGPT面世以来,短短几个月内,就出现了多个与GPT-3匹敌的大型模型。这无疑是一项重大的突破,标志着我国人工智能领域的研究取得了显著的成果。
2.算力、应用等环节的机遇与挑战
大模型对产业链的拉动主要体现在上游的算力环节和下游的应用环节。
在计算能力方面,主要的收益来源于模型的规模扩展。近年来,我们看到了大型语言模型(LLM)规模以每年翻十倍的速度增长。以2018年BERT的1亿参数为例,到2020年,GPT-3已经达到了百亿参数级别,而在2022年初发布的GPT-3.5更是达到了惊人的1750亿参数(数据来源:《Large Language Models: A New Moores Law?》,Julien Simon,Hugging Face)。即便不考虑训练数据集的扩增,参数量的增加也催生了训练计算能力需求的迅速上升。同时,伴随着更多应用场景和大模型结合的出现,推理阶段的计算需求有望呈现爆发性增长。根据TrendForce集邦咨询的预测,到2023年,AI服务器出货量将达到近120万台,同比增长38%。2022年至2026年,设备、AI服务器出货量的年复合增长率预计将达到22%,而AI芯片预计将在2023年实现46%的增长。
人工智能模型的算力需求呈现指数级增长
资料来源:Compute Trends Across Three Eras of Machine Learning(2022)
AI给逻辑芯片带来的增量测算
资料来源:上银基金权益投研部
在应用层面,人工智能可能带动传媒影视、游戏等行业的爆发式增长,同时也会促使机器人等新应用落地。
以机器人为例,一个简单的“拿薯片”指令就涉及多个计划步骤:例如走到抽屉旁,打开最上面的抽屉,拿起绿色的薯片,放在柜台上。传统的机器人很难完整执行此类复合型任务,主要困难集中在两个方面:
首先,传统机器人的操作流程通常从工程师开始,需要不断编写新代码和规则来纠正机器人的行为。这个过程缓慢、昂贵且低效,需要多次交互才能使机器人正常运行。
其次,机器人通常在明确具体任务和奖励的情况下表现最好,但在学习执行多步骤任务和推理抽象、模棱两可的指令方面存在困难。
然而,以ChatGPT为代表的大模型开启了一种新的机器人范式。一方面,大模型允许非技术用户参与控制回路,可以直接为机器人场景生成代码,在没有任何微调的情况下,利用大模型的知识来控制不同的机器人动作,以完成各种任务。另一方面,大模型也能够理解微妙的语句,例如“我刚刚锻炼过,可以给我拿一份健康的零食吗?”
类似的人工智能技术也有望在传媒影视、游戏等领域带来爆发式增长,比如通过大模型的智能和创造力,实现更出色的艺术创作。
大模型的出现改善了机器人对环境的适应性
资料来源:微软
然而,大模型的落地也面临一些挑战。
首先,大模型对计算资源的要求很高,需要大规模的计算设备和存储空间,这对企业和组织的投入提出了挑战。
其次,大模型的训练和部署需要处理大规模的数据集,而数据的质量和隐私问题也是需要考虑的重要因素。此外,大模型的复杂性也增加了模型可解释性的难度,这在某些领域,如法律和医疗等敏感应用中尤为重要。
总的来说,上银基金认为,算力和应用环节在大模型发展中具有重要地位。算力需求的增长将推动硬件产业的发展,并催生出更多高性能的AI服务器和芯片。同时,大模型的广泛应用将为各行各业带来创新和突破,但也需要应对算力、数据、模型解释性等方面的挑战,以实现大模型技术的可持续发展和应用的成功。
3.国内人工智能相关投资机会的展望
从投资角度来看,上银基金指出,算力板块直接受益于产业趋势,随着海量数据的收集、清洗、计算、训练和传输需求的增长,将带来算力和网络的迭代升级,利好AI数据中心和边缘高速计算所使用的GPU、CPU、FPGA、ASIC、HBM存储器、3D NAND、光芯片等。国外GPU的严重缺货,以及供应链的多元化需求也为国产AI芯片、服务器带来了适配机会。大模型的发展阶段是黄金窗口期,国内的算力芯片厂商具备良好的入局机会,相关的龙头企业有望明显受益。
此前,由于商业模式的缺陷,传媒影视、游戏和互联网软件等应用板块的估值普遍较低。因此,上银基金表示,AI应用行情的核心逻辑是用AI改造传统的商业模式,实现业绩与估值的戴维斯双击:需求端通过AI赋能提升用户体验,带来渗透率/斜率加快,供给端降本增效,释放更多产能,业务结构端提升软件算法平台权重,提升估值。当前,应用板块的估值修复基本完成,行情将进入逻辑驱动和业务驱动的第二阶段。在这个阶段,投资者应重点考虑业务的可持续性以及人工智能使用成本与客户需求的匹配度。
尽管目前人工智能仍处于产业趋势形成阶段,大模型和应用的格局不易判断,受事件催化影响较大,但该阶段正是成长股投资的最佳阶段,格局清晰后有望进入成长股的“价值投资”阶段,因此,上银基金认为,可以密切关注算力上游芯片放量以及下游AI服务器客户需求情况,并关注应用领域的真实客户需求;同时,投资者可以对机器人等具有现象级潜力的产品的落地保持期待,并结合行业发展动态理性投资决策。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!