《生成式人工智能：泡沫、算力、数据与金钱》

AIGC与创业2yrs ago (2023)update lida

205 0 0

文章标签:人工智能, 生成式人工智能, 聊天生成预训练转换器, ChatGPT

打开凤凰新闻，查看更多高清图片

参考消息网9月29日报道 英国《经济学人》周刊网站9月21日发表题为《ChatGPT热或在降温，但一个重要的新行业正在形成》的文章。文章认为，一个以超强劲的人工智能模型为核心的全新产业正在形成。编译如下：

自2022年11月启动以来，生成式人工智能领域引发了无与伦比的兴奋之情。短短两个月内，基于此技术的聊天生成预训练转换器（ChatGPT）便吸引了超过1亿用户。与此同时，全球范围内对“人工智能”的搜索量急剧上升。据统计，今年上半年，风险资本对人工智能公司的投资已超过400亿美元，足见人工智能领域的繁荣景象。

在此之后，对于ChatGPT的热度有所减退，使用谷歌搜索“人工智能”的人数逐渐减少。据悉，日本知名投资者孙正义，以其擅长布局有潜力市场的投资风格，计划成立一个以ChatGPT为核心的研究中心——OpenAI，以期在这个充满泡沫市场中站稳脚跟。然而，另一个更加关键的阶段已经悄然开始。一个以超强人工智能模型为基础的新兴产业正在逐步成型。它的未来将取决于三大因素的决定——是OpenAI继续保持主导地位，还是其他竞争者脱颖而出。

在众多影响因素中，算力成本首当其冲，对模型构建者来说，提高效率成为关键所在。举例来说，面对训练和运行更大规模模型的巨大成本，OpenAI并未选择直接训练下一大模型GPT-5，而是选择了GPT-4.5，这款当前领先产品的高效版本。这种策略可能会让谷歌等财力充足的竞争对手有了迎头赶上的一丝机会。据传，这家科技巨头即将推出的尖端模型“双子座”被认为在性能上超越了OpenAI的现有版本。

高昂的算力成本催生了众多规模较小的模型的快速发展。通过针对特定任务进行训练，这些模型能够胜任各种任务。以初创公司Replit为例，他们训练了一个用于生成计算机代码的模型，从而协助开发人员更高效地编写程序。开源模型的出现，使得个人和企业更易于涉足生成式人工智能领域。据人工智能企业抱抱脸公司统计数据显示，当前已有约1500个版本的此类微调模型。

在当前的生成式人工智能行业中，各大模型都在积极争夺数据资源，这已经成为影响该行业发展的第二个关键因素。其中，一些较大的模型，例如OpenAI和谷歌的模型，因其庞大的规模而被誉为“大胃王”。这些模型在进行训练时所需的数据量超过了1万亿个字，相当于250多个英文版的维基百科。随着这些模型的不断壮大，其对数据的需求也随之增加。然而，互联网的资源是有限的，这意味着这些模型将面临数据不足的问题。为了应对这一挑战，许多模型制造商已经开始与新闻和摄影机构签订合作协议，以便获取更多的训练数据。部分制造商甚至开始尝试利用新的数据形式，如视频，以创造出更具竞争力的“合成”训练数据。与此同时，这些制造商还在竞相开发能够超越竞争对手的模型，以满足行业的发展需求。

在生成式人工智能的驱动下，数据和算力的需求日益增长，这也使得第三个关键因素——经济价值变得更加重要。许多模型制造商已经开始转向付费业务，放弃面向大众的聊天机器人如ChatGPT。然而，非营利性项目起家的OpenAI在这个领域依然充满活力。它不仅向微软公司开放其模型，还为一汽集团、摩根士丹利和赛富时等公司提供定制化的解决方案。此外，阿联酋计划成立一家公司，旨在将其类似ChatGPT的开源人工智能模型“猎鹰”实现商业化应用。

一项可行的策略是吸引软件开发人员，使他们对你所提供的模型产生浓厚的兴趣，进而使其在技术层面上形成一种宝贵的网络效应。为了实现这一目标，OpenAI正努力提供相应的工具，以便开发人员能够运用其强大的模型构建出各种产品。与此同时，一些元宇宙平台公司也寄望于其开源模型llama，期望它能助力塑造一个忠诚的程序员社群。

在未来的竞争中，究竟哪个公司能够脱颖而出呢？拥有众多用户资源的OpenAI以及财力雄厚的谷歌显然具备明显的初始优势。然而，在计算能力和数据方面受到限制的情况下，那些能够巧妙地避开这些限制并实现高回报的策略，将有机会在市场中占据有利地位。因此，一个在算法创新、数据合成方法独特性以及对客户宣传方面表现最为突出的模型制造商，有望在未来脱颖而出。

炒作或许已经降温，但大戏才刚刚开始。

人工智能, 生成式人工智能, 聊天生成预训练转换器, ChatGPT