文章主题:人工智能, 聊天机器人, ChatGPT, OpenAI
编者按
自2022年11月以来,由美国人工智能研究公司OpenAI所研发的聊天机器人ChatGPT,以其惊人的速度迅速崛起,成为历史上增长最快的消费级应用程序,引发了全球的热烈关注。ChatGPT的问世,被视为人工智能发展的一个重要契机,它推动了各国在科技创新竞争中步入新的阶段。科技的进步,总是伴随着对应用场景的深入探索。尽管人工智能服务的智能化程度越来越高,但其核心目标——适应并满足人类的发展需求,始终没有改变。因此,面对未来,我们需要从多维度、多视域出发,去探讨ChatGPT对人的生产方式、生活方式、思维方式、行为模式、价值观念,以及产业革命和学术研究等方面产生的深远影响。通过对这些影响的深入理解和掌握,将有助于我们更正确地使用和管理这种技术,同时也能够帮助我们更好地思考人工智能的未来发展趋势。
自基于大规模语言模型开发的人工智能助手ChatGPT问世以来,其迅速在社会上引起了广泛的关注。仅仅两个月的时间,它的用户数量就已经突破了1亿大关。作为一种直接应用于OpenAI公司GPT-3.5模型的产品,ChatGPT的出现,标志着一种全新的文本生成方式。这种方式不同于传统的以句子为单位,通过块状文本拼接生成的方法,而是采用了基于概率的字词接龙式生成,也就是利用大规模语料库训练得到的语言模型,来生成自然语言文本。接下来,我们将从技术特性、功能影响以及行业应用三个方面,详细分析并探讨ChatGPT的应用和发展前景。
拥有三方面技术呈现特点
ChatGPT作为一款标志性的自然语言处理产品,其技术特性在算力提升方面表现得尤为显著。身为一款强大的对话式人工智能助手,ChatGPT具备三大技术特征,引领着自然语言技术领域的潮流。
开放域对话技术的挑战在于其应用场景的广泛性。相较于任务型对话技术,开放域对话的复杂度更高。任务型对话具有明确的范围和模式,通过积累相关数据进行监督学习,可以获得较为出色的表现。然而,开放域对话涉及的是社会各个群体之间的多样化对话内容,并无固定的应答格式。为了实现更具真实感的对话,开放域对话需要更加先进的对话技术和更大的计算资源。
ChatGPT 的第二个特性是它的连续多轮交互对话能力。这种能力使得 ChatGPT 能够根据用户输入的内容,结合之前的对话历史和上下文信息,提供更精准、更符合语境的回答。为了实现这一目标,ChatGPT 采用了被称为“上下文学习”的技术方法,在每一轮对话中,它都会把对话历史和当前用户的输入视为新的上下文,并据此生成下一轮的回答。这种多轮对话的方式有效地解决了用户的体验感受问题,形成了流畅自然的交流感,从而解决了过去聊天软件只能进行单轮生硬对话的问题。这标志着自然语言对话技术应用的一次重大突破。对于用户而言,多轮对话意味着机器能够更好地理解对话场景,与人进行更加连续、自然的对话,而不是像过去那样进行一问一答、毫无关联的单轮对话。
ChatGPT具备强大的多模态信息生成潜能。作为一款人工智能对话产品,ChatGPT能支持多种模态,如文本和代码,其技术优势主要集中在自然语言处理领域。ChatGPT是大型语言预训练模型GPT-3.5在对话系统领域的直接应用,未来有望与其他模型或工具相结合,有效生成多媒体相关文本描述,从而为多模态信息生成提供全新的解决方案。
让普通用户直接与人工智能对话
从功能角度看,ChatGPT具有聊天、检索、知识服务、AI创作四种互联网功能,是一个具备复合功能的人工智能产品。作为一款现象级的人工智能产品,ChatGPT标志着人工智能领域自然语言处理技术从“To B”到“To C”的重大转变。此前,已经出现不少面向大众的对话软件,但这些产品在使用规模、体验感等方面都无法与ChatGPT相比。ChatGPT对话框样式的产品界面让大规模普通用户能直接与人工智能流畅对话。
一是对话聊天功能。作为一款对话模型,聊天陪伴是ChatGPT提供的基础功能,日常闲聊或专业交流对其而言都不在话下。由于流畅的对话体验,ChatGPT得以在与用户对话过程中建立社交连接,满足用户的陪伴需求,对话聊天功能将是ChatGPT与用户建立黏性的重要功能。从微软小冰等社交机器人的经验来看,人机对话将成为数字交流的一个重要组成部分,而社会也有这个需求。人与ChatGPT建立的准社会交往关系,是人文社科领域值得持续关注的一个命题。
二是信息检索功能。由于ChatGPT在自然语言处理方面的技术迭代,将为用户提供更直接更有效的信息检索内容。更进一步看,与现阶段的搜索引擎需要用户自己从检索结果中寻找答案不同,集成了ChatGPT模型的对话式搜索将直接为用户提供最优的信息检索结果。ChatGPT模型有助于打造下一代搜索引擎,如微软打造的新必应搜索(new Bing)在这方面已经走在了同行前列。新必应已经打破了搜索引擎多年来形成的产品形态,成为新的搜索形态的开始。
三是知识服务功能。ChatGPT的模型拥有1750亿个参数,用以训练的数据集包含数百亿个单词,规模超过45TB空间,类型涵盖网页、电子书、新闻文章、论坛帖子、电子邮件、社交媒体等各种文本数据。因此,ChatGPT聚合了人类世界的广泛知识,能够以问答形式提供知识服务功能。更重要的一点是,ChatGPT的大模型对当前知识服务网站的准确度和质量提出了挑战,如它可以完成程序代码等具有一定难度的知识服务,甚至可以完成大学生作业和考试等,其知识服务能力也会持续增强。
四是AI创作功能。ChatGPT的强大之处在于它的输出是真正生成式(Generative)的。ChatGPT基于字词的概率分布,在文本生成时根据给定的输入前缀,预测接下来的字词,并将其作为生成文本的一部分。所以,ChatGPT可以根据用户提供的主题或关键词,自动生成新闻报道、评论、诗歌等文本内容,还可以创作图像等。AI创作降低了艺术创作的技巧门槛,人类可以直接进入情感表达的艺术创作之中。
将云服务提升至智能时代
从行业影响看, ChatGPT兴起带来的影响非常广泛,也将云服务从数字时代推进到智能时代,智能化将显著提升各行各业的生产效率。未来用户对云厂商的需求将聚焦智能服务,是模型、框架、芯片、应用的全方面竞争。具体到相关产业,人工智能的产业竞争至少包含三个方面。
一是复合功能的竞争。通用型的人工智能是众多科学家不懈追求的目标,但目前的技术还很难接触到通用型人工智能。即使是ChatGPT也只是处于专门化人工智能阶段,技术框架和技术逻辑没有革命性的突破,更多是过去技术的集大成。但ChatGPT能够完成对话聊天、知识服务、AI创作等多种复合功能,这是在专门化人工智能技术阶段的技术聚合的突破。换言之,复合功能的人工智能产品将是未来的发展方向。
二是大模型的竞争。ChatGPT带来的一个思考就是大模型将成为下一步人工智能领域的重要形态,人工智能技术将更多地从实验室走向应用大模型。GPT初代模型拥有1.17亿个参数,GPT-2的参数数量增加到15亿个,GPT-3的参数数量更是比上一代多了两个数量级,达到1750亿个参数。参数越多,大语言模型的智能化程度越高,这方面的竞争也会愈发激烈。
三是大资金的竞争。据有关报道,继微软在2023年1月23日宣布向OpenAI进行第三轮达数十亿美元的投资后,谷歌母公司Alphabet在2月4日向ChatGPT竞品Anthropic投入3亿美元,以开发生成式人工智能。人工智能越来越需要强大算力的支撑。大模型离不开大数据,可以预见,未来人工智能模型的训练集规模将呈现陡然增长的趋势。面对更多维度和更高量级的数据,算力是必要的支撑。因此,如何获得强大的算力将成为未来的竞争方向,但其前提就是需要有足够的资金支持。
最后,对于ChatGPT当前的火热态势,人们也应该冷静思考。我们要认识到,以ChatGPT为代表的人工智能只是一种技术手段,ChatGPT是一种更高效、更便捷的技术,是新技术的迭代。ChatGPT代表的是自然语言技术的一个方向,但不是技术的全部,自然语言处理技术领域还有很多可以开拓的方向。进一步来看,我们要从技术逻辑来理解人工智能技术,而不能将认知与判断建立在好莱坞电影式的想象之上,否则,就会对人工智能产生无意义的恐慌,认为技术会很快颠覆人类社会;或者盲目地夜郎自大,以小模型充当大模型,认为短时间突击加班就可以完成技术突破。这两种心态都不利于技术创新。应对人工智能技术的挑战,需要按照技术逻辑来理解,在技术逻辑基础上建立技术创新的运行规则,我们才有可能真正赶上人工智能时代的技术迭代发展。
(作者单位:北京师范大学新闻传播学院)
来源:中国社会科学报
责任编辑:刘娟
新媒体编辑:刘星
历史阅读
【解码ChatGPT⑯】ChatGPT:热话题需要冷思考【解码ChatGPT⑮】海伦·克朗普顿 | ChatGPT时代:教育如何创新
【解码ChatGPT⑭】罗曼·V. 扬波尔斯基 奥托·巴滕:ChatGPT等语言模型可能构成生存性风险
【解码ChatGPT⑬】韦斯利·J. 怀尔德曼 | 与机器共情:将人类意图与智能工具相结合
《【解码ChatGPT⑰】张洪忠 刘绍强:传播学视野中的ChatGPT技术逻辑》
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!