ChatGPT能否颠覆搜索？传统巨头的AI盛宴与挑战

AI与情感2yrs ago (2024)update lida

216 0 0

文章主题：关键词：ChatGPT, 传统搜索引擎, 替代, 数据实时性

🚀ChatGPT的崛起确实引发了对传统搜索引擎地位的深度审视，🔥但它短期内的挑战与革新并存。尽管它可能改变游戏规则，但SEO专家预测，它在中远期内不会完全颠覆市场，👀而是推动搜索引擎进化，形成以基础搜索为主、AI辅助的新格局。🔍谷歌等巨头的AI研发投入预计将显著增加。ChatGPT以其精准的问题解答能力，极大地提升了用户体验，但它也存在数据更新滞后和内容真实性难以判断的短板。💡技术的进步有望缓解这些问题，比如通过融合传统方法，但成本高昂仍是其一大挑战，需要时间等待硬件成本的降低。这场变革不仅加速AI产业的发展，🚀还预示着AI生成内容新时代的到来，带来信息海洋的新生态。🔍然而，用户教育和内容筛选也将成为未来的关键议题。让我们拭目以待，看这个创新如何重塑搜索世界！

▍报告缘起：

🌟ChatGPT的崛起，引发热议：未来搜索引擎的新挑战？💡2022年11月30日，OpenAI团队的力作——ChatGPT横空出世，仅两个月就吸引了超过千万的日活跃用户（DAU）和20万的月活跃用户（MAU），其强大的表现震惊了整个科技界。🔍以对话形式应对日常问题，ChatGPT展现出了全面且深入的解答能力，对多轮对话记忆的强化使其如虎添翼。相较于前辈GPT-3，它在知识丰富度和多角度阐述上更胜一筹，仿佛知识库无边无际。📚ChatGPT在内容搜索中的深度表现，不禁让人质疑其能否颠覆传统搜索引擎的地位。🔥这场革新性的讨论，不仅聚焦于技术的飞跃，也折射出行业格局可能的剧变。本报告将深入剖析ChatGPT的技术潜力以及它对现有搜索引擎巨头的影响，带你一窥这场智能革命的未来走向。🚀#ChatGPT #搜索引擎替代 #科技趋势分析

🌟ChatGPT引领未来搜索新风尚：通过升级的GPT3.5+人机互动学习，它以卓越的精准度重构了问题到答案的无缝对接。🔍相较于传统搜索引擎，其强大的学习能力和反馈优化让信息检索更高效、智能。🏆提升用户体验，引领技术潮流，ChatGPT正逐步成为你的知识导航器。

🌟🚀OpenAI’s AI refinement journey involves fine-tuning a GPT3.5 model with the power of Human Feedback RLHF 🚀💡. A meticulous process begins by sourcing ≈12k-15k question-answer pairs, meticulously crafted by human experts, for pre-training purposes. Next, an SFT (Super Fine-Tuned) model takes center stage, generating responses to fresh queries. These proposals are then evaluated by human annotators, refining their quality through a rigorous ranking process. The rewards, derived from these comparisons, shape a refined reward model (RM). This RM is further honed on a larger dataset, iteratively refining SFT until the optimal performance is achieved. 🧪🏆

🌟经过一系列优化，我们欣喜地看到ChatGPT模型在理解问题与提供精确答案的效能上实现了显著跃升！据Deepmind透露，相较于传统搜索引擎仅仅通过链接导航，ChatGPT具备了创新性——它能直接生成针对问题的高质量答案，并附带关键信息来源链接（测试版本中这一特性尤为亮眼）。🌟对于开放式问题，ChatGPT更是展现出强大的数据匹配能力，能够生成连贯且全面的答案。在知识密集型和创意领域，ChatGPT提供的搜索体验已然超越了现有的搜索引擎，堪称革命性的提升！🌐

▍ChatGPT取代传统搜索引擎：中短期可能性较低。

尽管ChatGPT能大幅优化用户的搜索体验，但要取代传统搜索引擎仍然面临几个关键技术瓶颈。

🌟ChatGPT数据更新挑战：实时性与技术限制交锋🌟🔥面对日益增长的语言处理需求，ChatGPT的英文版和中文版在数据更新上却存在显著差距——前者停留在2021年，后者仅至2020年，这背后的“定时器”并非偶然，而是大型语言模型技术发展的瓶颈。 olduğu gibi，复杂的标注数据训练模式使得实时更新成为难题，每轮预训练的昂贵成本（A100显卡+数周至月时间+百万美元以上）就像一道难以逾越的门槛。💡然而，简单地重训整个模型并非上策。微调虽然能快速融入新知识，但可能导致权重失衡——新旧并存却忽视了基础。频繁的调整可能会导致模型记忆混乱，犹如在知识海洋中迷失方向。解决之道在于找到平衡：优化训练策略，降低数据更新的成本，同时确保模型对新旧信息的兼容与稳定。让我们期待ChatGPT能以更高效的方式，跟上时代的步伐，为用户提供最鲜活、最准确的知识。🚀

2）数据的真实性仍不足可靠。在大量的测试后我们发现，虽然ChatGPT回答问题的准确性有所提高，但如果提出的问题较为模糊或者本身包含部分错误信息在内，模型有可能以“一本正经”的语气生成完全错误甚至凭空捏造的回答。真假答案的混杂会让用户在需要对专业性问题寻求答案时产生严重的困扰，这也是目前语言类大模型普遍存在的问题。据CSDN微信公众号报道，2022年11月几乎同一时间上线的Meta服务科研领域的语言类大模型Galactica就因为真假答案混杂的问题，测试仅仅3天就被用户投诉下线。

3）模型在线推理端成本高昂。根据模型的现有数据，我们假设每次生成的回答长度平均为50个词，使用8x英伟达A100用于推理的情况下，我们估算ChatGPT每一次生成答案的成本约为1.3美分，约为谷歌搜索引擎每次搜索成本的3倍。如果每天面对数以亿计用户的搜索请求，如此高昂的成本是公司所不能承受的，中短期内完全取代传统搜索引擎在商业模式上无法做到。

▍搜索引擎产品演变：传统搜索引擎为主+大语言模型为辅相结合。

目前ChatGPT的技术路径难以在较短时间内解决搜索成本的问题，因此从分场景限制用量的思路出发，我们认为中短期内ChatGPT可以通过部分技术改进辅助传统搜索引擎实现用户体验大幅提升。

1）考虑到ChatGPT在不同分类问题中的表现情况，限制ChatGPT搜索仅在知识类搜索场景下启用可以有效控制成本。

2）面对时效类问题时，模型自动判断转向传统搜索引擎生成答案，并通过传统搜索引擎的数据返回生成ChatGPT版本的汇总新答案。

3）针对回答真实性问题，加入对答案产生来源的引用注明给用户，让用户可以快速检验回答的可靠性。

总的来看，通过一些小技术的革新（大部分已经出现在了其他大语言模型中，只需要借鉴）就可以让ChatGPT成为一个合格的辅助搜索引擎。不过成本的问题短期内暂时看不到太好的解决方法，这也给了目前的搜索引擎巨头充足的时间以应对Chatgpt会带来的冲击。

搜索巨头如谷歌以及百度均在大语言模型上有深厚的积累，尤其是谷歌拥有与ChatGPT相似的对话类模型Sparrow以及Lamda，其部分技术更是在ChatGPT上有所突破，包括使用了多个RM模型以应对不良信息的产生以及加入了新知识迭代优化的相关思路。预计ChatGPT的成功不会给搜索产业带来颠覆性的新入局者，但会推动谷歌等搜索巨头加快迭代大语言模型辅助传统搜索引擎的新格局。

谷歌在最新一季度的财报电话交流会中表示：“谷歌将在未来几周或几个月正式推出类似ChatGPT基于大语言模型的人工智能。这种人工智能将以搜索伴侣的形式辅助其传统搜索引擎。”不过我们认为大语言模型的加入也会影响到中期谷歌等巨头的搜索业务利润空间。在平均每个用户生成50个单词的假设下，我们预计到2023年如果有10％的搜索结果由大语言模型生成，将会给谷歌每年带来约12亿美元的额外运营成本。

▍风险因素：

AI核心技术发展不及预期风险；科技领域政策监管持续收紧风险；全球宏观经济复苏不及预期风险；宏观经济波动导致欧美企业IT支出不及预期风险；全球云计算市场发展不及预期风险；企业数据泄露、信息安全风险；行业竞争持续加剧风险等。

▍投资策略：

受制于信息更新、回答准确性、算力成本等层面因素的综合约束，ChatGPT中短期内取代传统搜索引擎的概率较低，但料将加速搜索引擎产品演化进程，并在中期形成以传统搜索为主、ChatGPT类模型为辅的新搜索引擎形态，倒逼传统搜索厂商不断加大AI领域投入，同时鉴于目前全球搜索引擎的市场格局，份额较小的微软 Bing最有可能率先实验大语言模型的实际应用，谷歌等头部厂商亦将大概率被动跟随。ChatGPT产生的鲶鱼效应，料将推动全球AI产业化进程的全面提速，以及AI生成内容时代的全面到来。

本文源自金融界