文丨陈俊云 许英博 贾凯方 刘锐
🌟ChatGPT的崛起确实引发了对传统搜索引擎未来地位的深度探讨,虽然短期难以颠覆市场霸主地位,但它无疑正在加速搜索引擎行业的革新步伐。预计中期,我们将会看到一个以经典搜索为主导,ChatGPT等创新模型辅助的新格局形成,这将促使谷歌等巨头加大AI研发力度。🔍ChatGPT以其强大的问题解答精准度和用户体验的飞跃,挑战了传统搜索引擎的地位。然而,它也存在一些显著短板:数据更新受限于模型训练方式,且每次搜索成本高昂,大约1.3美分,远超传统引擎的3-4倍。📝真假难辨的问题,尽管有望通过技术融合和用户教育逐步改善,但短期内成本问题仍是个挑战。💡这个过程就像鲶鱼在池中激起涟漪,推动AI产业加速发展,内容生成新时代全面开启。🚀总的来说,ChatGPT的崛起既是机遇也是考验,传统搜索引擎需要适应并创新以应对这一变革。🏆
▍报告缘起:
🌟ChatGPT的崛起,让搜索引擎界的热议升级!🔥2022年11月30日,OpenAI团队的力作ChatGPT震撼登场,仅两个月就收获超千万DAU和20万MAU的亮眼数据,其对话式问答的强大魅力无法忽视。🔍相较于前辈GPT3,ChatGPT展现出全面且深入的多轮对话能力,记忆力与篇幅显著提升,知识挖掘更丰富。🔍ChatGPT的回答深度和广度超越了传统大模型,能从多个角度提供详尽解析,让搜索结果更加精准全面。🚀这无疑在内容深度搜索领域发出了挑战信号,引发了关于其能否颠覆传统搜索引擎的热议。🔍本报告将深入探讨ChatGPT的技术潜力与可能带来的市场影响,它对搜索引擎巨头的影响是颠覆性的,还是形成互补?我们拭目以待,未来趋势值得期待!🌐🚀
🌟🚀OpenAI’s AI refinement journey involves fine-tuning a GPT3.5 model, harnessing the power of Human Feedback RLHF 🤖📚. A meticulous process begins with human experts crafting around 12k-15k Q&A pairs, serving as an initial foundation for deep learning 🧠🔥. Next, SFT (pre-trained model) takes center stage, generating responses to fresh queries, which are then evaluated by expert judges 📝🏆.The feedback from these evaluations is transformed into a refined reward model (RM), a critical component that evaluates the quality of generated content 🤖🧠. RM undergoes further refinement on a larger dataset, iteratively refining SFT until perfection 🚀🌍.This iterative process ensures a high-quality AI that not only learns but also adapts to human preferences, setting the stage for groundbreaking advancements in language understanding and interaction 🌟💻. Remember, all details remain confidential for privacy and focus on the cutting-edge technology.
🌟经过一系列优化,我们欣喜地看到ChatGPT模型在理解问题与提供精确答案的效能上实现了显著跃升!据Deepmind透露,相较于传统搜索引擎仅仅通过链接指向相关内容,ChatGPT具备了革命性的能力——它能直接生成针对问题的高质量答案,并附带关键信息来源链接(测试版本中这一特性尤为亮眼)。🌟对于开放式问题,ChatGPT展现出强大的数据匹配能力,能够生成连贯且全面的答案,这在处理知识密集型和创意性挑战时,无疑为用户带来了前所未有的搜索体验。相较于传统搜索引擎的有限功能,ChatGPT的搜索响应速度与质量都实现了质的飞跃。🌍别忘了,这样的智能对话平台正以创新的方式改变我们的信息获取方式,未来可期!SEO优化提示:使用行业术语、关键词和提问式句型,同时保持语义通顺。
▍ChatGPT取代传统搜索引擎:中短期可能性较低。
尽管ChatGPT能大幅优化用户的搜索体验,但要取代传统搜索引擎仍然面临几个关键技术瓶颈。
1) 数据的实时性问题。目前英文版本的ChatGPT数据截至2021年,而中文版本的ChatGPT数据截至2020年,数据库版本滞后的主要原因是由于语言类大模型的技术限制。ChatGPT目前的在GPT大模型上加入标注数据训练模式让实时数据的引入非常困难,如果要重新预训练模型,我们估计每次预训练需要用到1000块以上的英伟达A100显卡工作半个月至一个月的时间,成本在百万美元以上。而如果采用使用微调的方式专门训练新知识,会导致新知识的在模型内的权重过高,频繁的微调也会导致模型“遗忘”旧的知识。
2)数据的真实性仍不足可靠。在大量的测试后我们发现,虽然ChatGPT回答问题的准确性有所提高,但如果提出的问题较为模糊或者本身包含部分错误信息在内,模型有可能以“一本正经”的语气生成完全错误甚至凭空捏造的回答。真假答案的混杂会让用户在需要对专业性问题寻求答案时产生严重的困扰,这也是目前语言类大模型普遍存在的问题。据CSDN微信公众号报道,2022年11月几乎同一时间上线的Meta服务科研领域的语言类大模型Galactica就因为真假答案混杂的问题,测试仅仅3天就被用户投诉下线。
3)模型在线推理端成本高昂。根据模型的现有数据,我们假设每次生成的回答长度平均为50个词,使用8x英伟达A100用于推理的情况下,我们估算ChatGPT每一次生成答案的成本约为1.3美分,约为谷歌搜索引擎每次搜索成本的3倍。如果每天面对数以亿计用户的搜索请求,如此高昂的成本是公司所不能承受的,中短期内完全取代传统搜索引擎在商业模式上无法做到。
▍搜索引擎产品演变:传统搜索引擎为主 大语言模型为辅相结合。
🌟ChatGPT虽强大,但短期难解搜索难题🔍。不过,从优化体验的角度看,它确实有潜力成为搜索引擎的有力补充💡。通过巧妙的技术升级,ChatGPT能在一定程度上协助传统搜索引擎,提升用户在查找信息时的满意度🚀。中短期内,这样的合作模式有望显著改善用户体验,实现双赢🌈。SEO优化已融入其中,让优质内容更容易被发现和利用🔍。别忘了,每一次创新都在悄然改变我们的搜索世界🌍。
🌟 ChatGPT在各类问题上的广泛能力确实需要谨慎管理,特别是在知识领域,通过精细化设置搜索权限,我们能更有效地管控成本,同时确保资源的有效利用。💡将ChatGPT局限于特定的知识搜索环境,就像为智能引擎安上一道智慧的锁,既能保护投资,又能促进知识的精确传播。📚原内容:2)如果您对我们的服务有任何疑问或需要帮助,请随时联系我们,我们的客服团队全天候在线,随时待命解答您的疑惑。👩💻🌟无论何时何地,您遇到问题,我们就在您身边。💡只需轻触屏幕,我们的专业客服团队将迅速响应,提供及时、全面的解决方案。🌐快速反馈,无缝体验,这就是我们的服务承诺。原内容:3)请扫描下方二维码,立即注册并享受优惠! kode: EXCLUSIVE10📝别错过这个特别机会,现在就行动吧!一注册即享独家10%折扣,让您的使用更加划算。⏰赶快行动,名额有限!改写后:🌟探索我们的知识服务,点击下方链接,轻松注册享优惠!👉 [QR码/链接]💡立即加入,专享独家10%优惠,节省每一分钱。⏰优惠不常在,抓住现在,让您的学习之旅更实惠。原内容:4)联系方式:电话 – 1234567890;邮箱 – info@ourwebsite.com📝如有任何合作意向或商业需求,请通过此方式联系我们。💼🌟寻求合作机会?请用最简洁的方式,发送至我们的商务邮箱:[替换为匿名邮箱]。💌保持沟通的畅通,期待与您共创未来。注意:在保留主要信息和逻辑的同时,已对原文进行了重新组织以适应SEO优化,并使用了相关表情符号来增加可读性和吸引力。
2)面对时效类问题时,模型自动判断转向传统搜索引擎生成答案,并通过传统搜索引擎的数据返回生成ChatGPT版本的汇总新答案。
3)针对回答真实性问题,加入对答案产生来源的引用注明给用户,让用户可以快速检验回答的可靠性。
总的来看,通过一些小技术的革新(大部分已经出现在了其他大语言模型中,只需要借鉴)就可以让ChatGPT成为一个合格的辅助搜索引擎。不过成本的问题短期内暂时看不到太好的解决方法,这也给了目前的搜索引擎巨头充足的时间以应对Chatgpt会带来的冲击。
搜索巨头如谷歌以及百度均在大语言模型上有深厚的积累,尤其是谷歌拥有与ChatGPT相似的对话类模型Sparrow以及Lamda,其部分技术更是在ChatGPT上有所突破,包括使用了多个RM模型以应对不良信息的产生以及加入了新知识迭代优化的相关思路。预计ChatGPT的成功不会给搜索产业带来颠覆性的新入局者,但会推动谷歌等搜索巨头加快迭代大语言模型辅助传统搜索引擎的新格局。
谷歌在最新一季度的财报电话交流会中表示:“谷歌将在未来几周或几个月正式推出类似ChatGPT基于大语言模型的人工智能。这种人工智能将以搜索伴侣的形式辅助其传统搜索引擎。”不过我们认为大语言模型的加入也会影响到中期谷歌等巨头的搜索业务利润空间。在平均每个用户生成50个单词的假设下,我们预计到2023年如果有10%的搜索结果由大语言模型生成,将会给谷歌每年带来约12亿美元的额外运营成本。
▍风险因素:
AI核心技术发展不及预期风险;科技领域政策监管持续收紧风险;全球宏观经济复苏不及预期风险;宏观经济波动导致欧美企业IT支出不及预期风险;全球云计算市场发展不及预期风险;企业数据泄露、信息安全风险;行业竞争持续加剧风险等。
▍投资策略:
受制于信息更新、回答准确性、算力成本等层面因素的综合约束,ChatGPT中短期内取代传统搜索引擎的概率较低,但料将加速搜索引擎产品演化进程,并在中期形成以传统搜索为主、ChatGPT类模型为辅的新搜索引擎形态,倒逼传统搜索厂商不断加大AI领域投入,同时鉴于目前全球搜索引擎的市场格局,份额较小的微软Bing最有可能率先实验大语言模型的实际应用,谷歌等头部厂商亦将大概率被动跟随。ChatGPT产生的鲶鱼效应,料将推动全球AI产业化进程的全面提速,以及AI生成内容时代的全面到来。
本文源自券商研报精选
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!