文章主题:ChatGPT, 人工智能, 乔姆斯基, 生成语法
感谢您关注“永大英语”!
为何乔姆斯基对ChatGPT持否定态度?
冯志伟 张灯柯
🌟【深度解析】ChatGPT掀起热议:技术与伦理的微妙碰撞🚀于2023年3月8日,知名语言学家乔姆斯基携手罗伯茨(Ian Roberts)和瓦图穆尔(Jeffrey Watmull),在《纽约时报》上发表了犀利观点——一篇名为“ChatGPT的虚假承诺”的文章。他们聚焦于人工智能与人类思维本质的区别,提出尖锐警示:AI的学习路径与创造解释的能力,以及道德判断,皆非人类可比。🚀ChatGPT的崛起,引发了一场关于科技对知识水平和道德标准潜在影响的深度讨论。乔姆斯基直指其背后的大型语言模型并非原创,而是潜在的“学术剽窃”行为,这无疑是对创新精神的挑战。📚这样的对话,不仅揭示了技术进步的双刃剑,也促使我们重新审视人工智能的发展路径,确保它既能带来便利,又不违背伦理底线。💡欲了解更多关于ChatGPT引发的思考风暴,敬请关注未来相关领域的深度分析和探讨。🌈
🌟认知语言学大师乔姆斯基对GPT的立场并不赞同,这其实也在情理之中。在他的开创性理论——生成语法中,语言哲学的深刻洞见为其赋予了鲜活的生命力。特别是关于人类知识的内在属性、起源与应用的核心议题(引用:Chomsky, 1995),这一观点被誉为“洪堡特难题”,在学术界引起了广泛讨论。他的观点强调了语言知识并非机械复制,而是源于个体认知和文化传承的独特智慧结晶。对于现代人工智能技术如GPT的生成能力,乔姆斯基可能会从这个哲学角度进行批判性反思。
🌟洪堡特曾深刻揭示:“語言并非產物,而是創意之源”,它像心智的旋律,將音節轉化為思想的符號。探索人類語言學的本質,關鍵在於理解如何塑造這門知識——有限工具的無限可能。 ønsker的核心,即洪堡特所強調的“有限規則的無盡應用”。語言學的內涵,藏匿於心智與大腦之間的語言認知網絡中,一套遵循特定數量原則和規則的系統在運作。抽象語法規則是構建語言知識的基石,它們雖隱而不見,卻深深塑造了我們的言談举止。乔姆斯基認為,這些無形的語言智慧,既是潛意識的,也是不言而喻的。
🌟乔姆斯基见解独特:语言知识与使用技巧分离!💡他强调,尽管我们共享相同语言的丰富内容(发音、词汇和句法),个人的语言表现差异却可能显著。👀 语言能力,就像技能一样,可塑且易变,而语言知识则是稳固的内在特质。💪即便遭遇困难,语言能力受损甚至消失,人们依然保有对语言结构的理解,这是心智深处的固有能力。🧠 而生成语法专注于探究这些心智层面的语言原理,而非实际操作中的行为表现。📖换句话说,语言知识是思维的核心,而语言能力则是行动的体现。两者相辅相成,共同塑造我们的沟通世界。🌐
🌟【GPT技术揭秘】🚀数据驱动的”端到端嵌入”力量,让GPT在非人类语言行为中展现出卓越效能,但这并非无边界的工具,它受限于我们理解世界的独特路径——不同于乔姆斯基对语言知识核心的理解。🔍这种技术的有效性,并不意味着可以无限扩展,它遵循着一套特定的规则和边界,就像科学探索一样,每一步都揭示了自然语言行为的深度而非无限可能。🎯尽管GPT在创新领域独领风骚,但我们不能忽视其背后的逻辑与局限,它强化了我们对人工智能理解的深度,而非简单地替代人类智慧。🧠SEO优化提示:使用关键词”端到端嵌入”、”数据驱动”、”语言知识本质”、”有限手段”和”科学探索”等。
🌟探讨知识之源:柏拉图难题在现代语境下的深层解析 📚面对我们如何从有限的接触中获取丰富且具体的知识这一困惑,西方哲学中的”柏拉图问题”为我们揭示了语言知识的独特来源。🤔 柏拉图曾质疑,为何短暂的人类与世界互动却能构建出复杂而精密的认知体系?这背后的奇迹是如何产生的呢?儿童学习语言的迅速和一致性,是心理学家乔姆斯基提出的生物遗传认知机制的有力证据。🧠 他提出,这些内在的心智器官(mental organs),在适当的刺激下得以自然发育,形成所谓的”语言机能”(language faculty)。正是这个语言能力,如同种子在适宜环境中生根发芽,决定了我们的语言知识如何生成和扩展。理解语言知识的起源,就像探索一个神秘的谜团,每个儿童的心智之光都揭示了心智器官的力量。💡 通过这样的视角,我们不仅解答了知识的奥秘,也对人类认知能力的无限可能有了更深的认识。🌍记得关注我们的文章,获取更多关于思维与语言的深度解析!👇
研究发现,FOXP2是人类的独特基因。这一基因与其他哺乳动物的类似基因同属于一个家族,然而,这基因的排序却是人类特有的。因此,FOXP2也许就是乔姆斯基所假设的“语言机能”的生物学基础。由于存在FOXP2,所以,语言是天赋的,FOXP2给语言天赋论和刺激贫乏论提供了生物学上的支持(俞建梁,2011)
语言机能有初始状态(initial state)和获得状态(attained state)。初始状态是人类共同的、普遍一致的;获得状态是具体的、个别的。语言机能的初始状态叫做“普遍语法”(Universal Grammar,UG),语言机能的获得状态叫做“具体语法”(Particular Grammar,PG)。对普遍语法的本质特征及其与具体语法的关系的研究和确定,是解决关于语言知识的“柏拉图问题”的关键。
GPT采用的数据驱动的“端到端嵌入”技术对于非人类的自然语言机器学习是行之有效的,但是,这种技术依靠大规模的语言数据,根本不存在“刺激贫乏”的问题,与乔姆斯基对于语言知识来源的认识是大相径庭的。
乔姆斯基把语言知识的使用问题叫做“笛卡儿问题”(Cartesian problem)。基于机械论哲学的物质概念,法国哲学家和数学家笛卡儿(Descartes)认为,所有非生命物质世界的现象、动物的生理与行为、大部分的人类器官活动,都能够纳入物质科学(science of body)的范畴。但是。笛卡儿又指出,某些现象不能处于物质科学的范畴之内,其中最为显著的就是人类语言,特别是“语言使用的创造性方面”,更是超出了机械论的物质概念所能够解释的范围。所以,对于语言的正常使用,是人类与其他动物或机器的真正区别。为了寻求对于语言这一类现象的解释,笛卡儿设定了一种“第二实体”的存在,这种第二实体就是“思维实体’(thinking substance)。“思维实体”明显不同于物质实体,它与物质实体相分离,并通过某种方式与物质实体相互作用。这一种“思维实体”就是心灵或者心智。语言知识的使用是内在于心智/大脑的。因此,对于这样的问题是很难解决和回答的。
GPT采用的数据驱动的“端到端嵌入”技术对于非人类自然语言的使用是行之有效的,但是,这种技术与“思维实体”没有关系,与乔姆斯基对于语言知识使用的认识是完全不同的。乔姆斯基主张,语言是语言机能或者语言器官所呈现的状态,说某个人具有语言L,就是说他的语言技能处于状态L。语言机能所获得的状态能够生成无限数目的语言表达式,每一个表达式都是语音、结构和语义特征的某种排列组合。这个语言机能所获得的状态是一个生成系统或者运算系统。
为了与一般人理解的外在语言相区别。乔姆斯基把这样的运算系统,叫做“I语言”。字母I代表内在的(internal)、个体的(individual)、内涵的(intensional)等概念。这意味着,I语言是心智的组成部分,最终表现于大脑的神经机制之中,因此,I语言是“内在的”。I语言直接与个体有关,与语言社团存在间接的联系。语言社团的存在取决于该社团的成员具有相似的I语言,因此,I语言是“个体的”。I语言是一个函数或者生成程序,它生成一系列内在地表现与心智/大脑中的结构描写,因此I语言是“内涵的”。根据这种对于I语言的认识。乔姆斯基指出,基于社会政治和规范目的论因素之上的关于语言的通常概念,与科学的语言学研究没有任何关系,这些概念都不适合用来进行科学的语言研究。
生成语法对于语言的科学认识是内在主义(internalist)的,而GPT的大语言模型则是外在主义的(externalist)。GPT的方法是在广泛搜集语言材料的基础上,把离散的语言符号转化为词向量,通过机器学习来获取概率性的语言参数。这些参数存在于外部世界,处于人类的心智/大脑之外。GPT的方法是经验主义的方法,这种方法的基础是外在主义的语言观。乔姆斯基认为,根据外在主义的语言观,人们不能正确地认识和揭示人类语言的本质特征,不能解释人类语言知识获得的过程。只有内在主义的语言观才有可能正确地、全面地认识和解释人类语言知识的本质、来源和使用等问题。
乔姆斯基认为,生成语法的研究应当遵循自然科学研究中的“伽利略-牛顿风格”(Galilean-Newtonianstyle)。“伽利略风格”的核心内容是:人们正在构建的理论体系是确实的真理,由于存在过多的因素和各种各样的事物,现象序列往往是对于真理的某种歪曲。所以,在科学研究中,最有意义的不是考虑现象,而应寻求那些看起来确实能够给予人们深刻见解的原则。伽利略告诫人们,如果事实驳斥理论的话,那么事实可能是错误的。伽利略忽视或无视那些有悖于理论的事实。“牛顿风格”的核心内容是:在目前的科学水平下,世界本身还是不可解释的,科学研究所要做的最好的事情就是努力构建具有可解释性的理论,牛顿关注的是理论的可解释性,而不是世界本身的可解释性。科学理论不是为了满足常识理解而构建的,常识和直觉不足以理解科学的理论。牛顿摒弃那些无助于理论构建的常识和直觉。因此,“伽利略-牛顿风格”的核心内容是:人们应努力构建最好的理论,不要为干扰理论解释力的现象而分散精力,同时应认识到世界与常识直觉是不相一致的(吴刚,2006)。
生成语法的发展过程,处处体现着这种“伽利略-牛顿风格”。生成语法的目的是构建关于人类语言的理论,而不是描写语言的各种事实和现象(冯志伟,2009)。
语言学理论的构建需要语言事实作为其经验的明证。但是,采用经验明证的目的是为了更好地服务于理论的构建,生成语法所采用的经验明证一般是与理论的构建有关的那些经验明证。因此,生成语法研究的目的不是全面地、广泛地、客观地描写语言事实和现象,而是探索和发现那些在语言事实和现象后面掩藏着的本质和原则,从而构建具有可解释性的语言学理论。所以。在生成语法看来,收集和获得的语言客观事实材料越多,越不利于人们对于语言本质特征的抽象性的把握和洞察,而探索语言现象的可解释性,才是语言研究的目标之所在。GPT尽管功能强大,但是至今仍然是一个“黑箱”,不具有可解释性(Linzen,2019)。
乔姆斯基对于人类语言知识的本质、来源和使用问题的看法,与GPT对于非人类语言知识的本质、来源和使用问题的看法针锋相对,且GPT不具有可解释性,因此,乔姆斯基对于GPT持否定的态度,也就不足为奇了。
(参考文献 略)
(本文首次发表在《外语电化教学》2023年第2期)
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!