文章主题:文章关键词:ChatGPT, AI, 聊天机器人, 人工智能技术
《这就是ChatGPT》
[美] 斯蒂芬·沃尔弗拉姆 著
WOLFRAM传媒汉化小组 译
图灵|人民邮电出版社出版
这是我国首个由全球顶尖AI专家、科技领域的创新先锋以及“人工智能领域第一项真正实用的实现”搜索引擎WolframAlpha的创立者斯蒂芬·沃尔弗拉姆所创造的ChatGPT杰作。ChatGPT是由OpenAI研发的一款人工智能对话机器人程序,于2022年的11月份正式亮相,具备自动生成看似出自人类之手的文字的能力,这一成就可谓令人瞩目,超出所有人的预期。接下来,我们将探索ChatGPT是如何实现这一功能的,以及它为何能生成出我们认为是具有实际意义的文本。本书详细解析了ChatGPT的工作原理,并深入探讨了其背后的机制,让我们能够理解ChatGPT是如何生成这些看似真实、有意义 text 的。
ChatGPT 的基本原理可以简要概括为:通过从互联网和书籍等来源收集大量人类生成的文本样本,训练一个神经网络以生成类似于这些文本的文本。更为重要的是,该模型具备从单一提示出发,生成与训练数据相似的文本的能力。
ChatGPT中的神经网络基础部分非常简洁,尽管其包含数十亿个元素。其核心操作十分直观,可以概括为针对每一个新生成的词汇(或词汇片段),将其基于当前生成的文本所获得的输入依次传递给其所有的神经元。这种传递过程没有循环等复杂操作。
值得注意的是,令人意外的是,这一过程能够成功生成类似于互联网、书籍等内容的文本。ChatGPT不仅具备生成连贯人类语言的能力,而且还能够依据先前的“阅读”内容,遵循提示进行相应的表述。然而,需要注意的是,它并非始终能够说出具有全局意义的语句(或满足正确计算的要求),因为只有在充分利用Wolfram|Alpha的“计算优势”的情况下,才能确保其生成的语句在整体上具备意义。换言之,ChatGPT所提供的言论只是基于训练材料中某些内容的表现形式,从而使得这些言论在某种程度上看似“正确”。
ChatGPT 的具体工程引起了广泛的关注。然而,在其具备运用外部工具的能力之前,ChatGPT仅仅是依赖其积累的大量统计数据来生成一些连贯的文本信息。然而,这种方法所产生的人类般的文本质量已经足以让人感到震撼。
如我所说,这揭示了至少在科学领域中具有重大意义的现象:人类语言及其背后的思维模式在结构和规律方面比我们想象的更为简单。ChatGPT已经暗示了这一事实。然而,我们可以通过语义语法、计算语言等方法来揭示其真相。
ChatGPT在生成文本方面表现得非常出色,结果通常非常类似于人类创作的文本。这是否意味着ChatGPT的工作方式像人类的大脑一样?它的底层人工神经网络结构说到底是对理想化大脑的建模。当人类生成语言时,许多方面似乎非常相似。
当涉及训练(即学习)时,大脑和当前计算机在“硬件”(以及一些未开发的潜在算法思想)上的不同之处会迫使ChatGPT使用一种可能与大脑截然不同的策略(在某些方面不太有效率)。
还有一件事值得一提:甚至与典型的算法计算不同,ChatGPT内部没有“循环”或“重新计算数据”。这不可避免地限制了其计算能力——即使与当前的计算机相比也是如此,更谈不上与大脑相比了。
我们尚不清楚如何在“修复”这个问题的同时仍然让系统以合理的效率进行训练。但这样做可能会使未来的ChatGPT能够执行更多“类似大脑的事情”。当然,有许多事情大脑并不擅长,特别是涉及不可约计算的事情。对于这些问题,大脑和像 ChatGPT 这样的东西都必须寻求“外部工具”,比如Wolfram语言的帮助。
但是就目前而言,看到ChatGPT已经能够做到的事情是非常令人兴奋的。在某种程度上,它是一个极好的例子,说明了大量简单的计算元素可以做出非凡、惊人的事情。它也为我们提供了 2000多年以来的最佳动力,来更好地理解人类条件(human condition)的核心特征——人类语言及其背后的思维过程——的本质和原则。
编辑:周怡倩
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!