ChatGPT颠覆未来？技术之路与治理挑战在哪？

AIGC与游戏11mos agoupdate lida

114 0 0

文章主题：ChatGPT, OpenAI, 聊天机器人, 自然对话

666ChatGPT办公新姿势，助力做AI时代先行者！

九卦 | 祝世虎：ChatGPT的发展与治理

作者 | 祝世虎光大信托科技部副总经理、数据中心总经理；CIC金融科技和数字经济发展专家委员会委员

来源 | 《中国银行业》杂志2023年第5期

导语：回顾人类历史，技术和伦理紧密交织，面对科林格里奇困境，笔者认为，社会伦理优先于技术创新。

在新兴技术的设计和开发过程中，应优先考虑和满足为人类服务的伦理要求，最大限度利用技术创新造福人类。结合我国国情，对于AIGC的治理分为监管治理、行业自律、企业自治、全民共治四个方面。

ChatGPT颠覆未来？技术之路与治理挑战在哪？

ChatGPT发展与治理面临科林格里奇困境

🌟ChatGPT🔥是由顶尖AI研究机构OpenAI打造的全能型聊天伙伴，它以超自然的对话体验为用户提供服务，能应对各种棘手的语义挑战。从创意写作到代码编写，无论文本还是代码，它都能轻松应对。💡自动问答、翻译和文本生成等强大功能，让日常生活与工作更为便捷。这款创新技术已渗透到各行各业，成为跨领域协作的重要工具。无论是教育、医疗、科技，还是日常娱乐，ChatGPT都以其强大的适应性和广泛影响力，为用户带来前所未有的便利。🌍无论你身处何方，只需轻轻一触，就能开启这段智能对话之旅。欲了解更多关于ChatGPT如何改变世界的信息，敬请关注我们的最新动态，我们将持续分享其前沿应用和卓越性能。👩‍💻👨‍💻

本质上而言，ChatGPT是AIGC（Artificial Inteligence Generated Content）人工智能生成内容的一种。从技术角度看，AIGC的发展与应用，是一个新技术形成新生产力的问题；从治理角度看，是一个牵一发而动全身的社会问题；从哲学角度看，其中蕴藏着人类与AI边界的哲学问题。

综合来看，ChatGPT的发展与治理是一个典型的科林格里奇困境（Collingridges Dilemma），指的是一项技术如果因为担心不良后果而过早实施控制，那么技术很可能难以爆发，反之如果控制过晚，技术已经成为经济和社会结构的一部分，就可能走向失控，再来解决问题就会变得更加昂贵、更加困难。

ChatGPT的技术分析

从技术角度对ChatGPT的算法分析并不容易理解，笔者尝试从逻辑思维角度解释ChatGPT技术。OpenAI的工程师们接到的任务是：要做一个拥有人类智能的机器；工程师们的思路如下：首先，要创建一个“大脑”；其次，要整理学习资料；再次，掌握学习方法；最后，学成归来。这就是ChatGPT技术路线的逻辑框架。

第一步，构建“大脑”。工程师认为这应该是一个“通用大脑”，这就是通用人工智能AGI的构想：AGI应该是一个大系统，系统的核心是一个与任务无关的“通用”大模型，大模型依靠大算力从海量大数据中学习人类的知识，从而形成AI智能，这一步体现了工程师的系统思维，与通用复用的工程思维。

第二步，整理学习资料。人类知识的载体是文字、语言、图画等，所以，工程师选择了大型语言模型LLM（Large Language Model）。在工程师眼中，大算力、大存储、大数据使得大模型的工程实践成为可能，随着数据越来越丰富，算力越来越强，模型越来越大，效果也会越来越好，这体现了工程师们“力大砖飞”的实用思维，但并没有从算法上对“力大砖飞”进行严格论证。

第三步，掌握学习方法。在当时的NLP（Natural Language Processing）领域，深度学习模型已经遭遇瓶颈，通过增加模型层深来提升模型效果微乎其微，深度学习模型已经逐步被预训练模型所取代，预训练模型的公式为：模型性能=预训练性能（数据+任务）+微调性能（数据+任务）。

🌟BERT与GPT：深度解析中的平行世界🔍在预训练模型的大海中，BERT和GPT无疑是两颗璀璨的明珠，它们虽看似相似，实则内在运作机制大相径庭。💡源于Transformer架构的这两种技术，各自践行着自然语言处理的不同路径。十年文献的沉淀，BERT以其严谨的双向编码策略赢得了研究者们的青睐，他们倾向于循序渐进，从理解文本开始，逐步迈向生成。📚而工程师们则更偏向于直接跳过理解环节，追求一步到位的生成能力，这就是GPT所倡导的简洁高效。🚀BERT与GPT的选择，反映出研究者和实践者的思维差异：前者遵循逻辑链条，后者寻求创新简化。两者并存，共同推动着自然语言处理技术的进步。🏆

🌟🚀掌握未来文本创作！🔥下面是革新性的语言生成技术发展历程：💡GPT1凭借预训练智慧，解锁语言理解的钥匙；🔍GPT2巧妙迁移，如虎添翼，信息利用更高效；📈GPT3解决了数据小挑战，泛化能力飞跃；🛠️GPT3.5通过指令遵循与精调，打破人机交互壁垒；🚀GPT4将理论升华为实践，引领技术革命浪潮。每一代的迭代都标志着语言生成的进步，它们以独特的方式优化了信息处理和人机互动。让我们的文字创作更加精准、流畅且富有深度！🌍✨

第四步，学成归来。随着大算力、大数据的“厚积薄发”，大模型“量变突破质变”，大语言模型的智力涌现（Emergent Abilities of Large Language Models）出现了。

🚀技术革新之旅，三大里程碑引领成功之路💡从实验室的突破到产业化试错，每一步都至关重要。首先，创新理论在象牙塔中孕育，新技术在这里熠熠生辉；然后，工程师们犹如魔术师，将科技梦想转化为切实可行的成本降低策略；最后，市场如同试金石，对技术进行无情却公正的磨砺，推动其走向成熟。我们正站在这个决定性的时刻，产业应用的探索正如火如荼展开。SEO优化提示：#技术创新 #成本控制 #产业试错记得，每一次技术的进步都是对未来的预告，让我们共同期待这趟旅程带来的惊喜与变革吧！😊

ChatGPT颠覆未来？技术之路与治理挑战在哪？

ChatGPT的技术缺陷

🌟虽然ChatGPT的崛起仿佛得益于科技的日新月异，但它并非完美无瑕。🔍尽管其强大的功能让人眼前一亮，技术瓶颈的存在也不可忽视，这些限制在一定程度上制约了它的全面表现。💻尽管我们被其创新所震撼，但对其潜在的技术瑕疵也需保持清醒的认识。

应用平民化，但建模贵族化。应用平民化指的是ChatGPT提供了便捷的API接口，每个人都可以很方便地接入；建模贵族化指的是建模的成本太高了。ChatGPT的训练需要大量的训练样本、大量的算力，这些背后更是数百名工程师以及大量内容提供者。总体而言，在应用平民化的同时，ChatGPT研究却越来越贵族化。

AI“大而不便改”，使得人去适应AI。在ChatGPT的1750亿个参数中，以“某种方式”存储着人类的知识，但这些参数的逻辑关系、学习过程等从技术上却尚未完全明确。这些参数的修改主要是靠训练，而训练依赖的是昂贵的数据集，会产生“大而不便改”的缺陷。所以，这可能会产生一个“反直觉”的问题：究竟是人去适应AI大模型，还是AI大模型去适应人。以人和手机为例，从客户体验角度看，好像是手机在适应人的操作，但本质却是人去适应手机给我们带来的生活方式！

智能缺陷：感知智能而非决策智能。从技术角度智能类型可以分为三类：基于贝叶斯公式的感知智能、基于先验概率的决策智能、基于计算公式的计算智能。从前述ChatGPT的技术分析不难看出，ChatGPT是通过文本语言等训练的模型，其智能类型是受限的，是局限在文字语言领域的感知智能，而非决策智能，更不是计算智能。

智能缺陷就是ChatGPT的使用边界。例如，在金融机构中，ChatGPT不是决策智能，若用于风险决策将受到限制；ChatGPT不是计算智能，若用于资本计量也将受到限制；ChatGPT是语言领域的感知智能，是可以以文字助手的身份嵌入大部分与文本相关的工作。

AI算法固有缺陷。提起ChatGPT有人可能会有疑问，为什么ChatGPT只提供了API接口而很少开源，这就揭示了ChatGPT作为一种人工智能算法的固有缺陷：算法黑箱、算法鲁棒性、算法歧视等。算法黑箱，是指由于算法模型的黑箱运作机制，其运行规律和因果逻辑并不会显而易见地摆在研发者面前。算法鲁棒性，指的是算法运行容易受到数据、模型、训练方法等因素的干扰。算法歧视，指的是算法以数据为原料，如果初始使用的是有偏见的数据，无形中会导致生成的内容存在偏见或歧视，引发用户对于算法的公平性争议，这种歧视可能主要来自于资本对于训练数据的控制。

极简版

一是训练数据的获取，ChatGPT通过抓取互联网上的信息获得训练数据，可能存在合规问题。

二是在个人信息收集阶段，当用户使用ChatGPT时，可能会输入个人数据，根据《个人信息保护法》要求需要单独授权。

三是在个人数据的加工使用阶段，ChatGPT使用了RLHF（Reinforcement Learning from Human Feedback）的训练方法，即以强化学习方式依据人类反馈优化语言模型，用户使用过程中的输入和交互信息可能会用于持续迭代训练，进一步被用于为其他用户提供服务，从而可能构成数据共享，这时已与用户最初数据使用目的和范围相悖，根据《个人信息保护法》要求需要重新授权。

四是数据泄露，用户在使用过程中输入的信息，以及企业用户输入的各类工作信息，可能导致公司敏感信息泄露。

五是算法缺陷导致数据主体行权困难，ChatGPT的算法黑箱与算法复杂性导致数据主体的基本权利，如更改权、删除权、访问权等行权困难。

ChatGPT的潜在风险

ChatGPT所引发的潜在社会问题主要来自工作岗位、“机器宣传”、人与AI的边界等方面，以及由此可能造成的一系列社会风险。

工作岗位被取代的潜在风险。ChatGPT推出以来，不少新闻报道或文章分析其会取代一些人的工作。ChatGPT本质上是通过科技创新提高生产效率，是生产力的跃升，这与历史上的生产力提升一样，比如，蒸汽机替代马车、电力的广泛使用替代蒸汽机等，都是以更少的人力去生产商品，让节约的人力进入新兴行业，增加新的商品和服务供给。虽然会在短时间内对人类的就业结构产生冲击，但由于人力资源的稀缺性，中长期不会导致大规模失业的问题，只是就业结构发生了变化。

这种结构变化可以用一句话来概括：一群人的工作是发展AI，一群人的工作是被AI所取代，取代你的不是AI，而是先掌握AI能力的人。

“机器宣传”的潜在风险。ChatGPT为代表的AIGC的内容生成，可以在短时间内制造大量包括文字与图片在内的“新内容”，其受制于训练数据的分布。也就是说，虽然ChatGPT的技术是理性、中立、客观的，但是由于训练数据存在歧视，可能导致输出结果存在歧视，导致“机器宣传”可能存在风险，这种风险在技术中立的掩盖下具有一定的隐蔽性。所以，需要大力推动人工智能工具理性与价值理性的双向平衡，构建内容与监管的融合统一。

“资本逐利”的潜在风险。在ChatGPT之前的一个热点是元宇宙，ChatGPT火爆以后，元宇宙迅速降温，给人的感觉是二者此消彼长。但从技术角度来看，AIGC客观上为元宇宙中UGC（User Generated Content）创作提供了助力。元宇宙设想通过用户创作内容的方式来打造元宇宙，而AIGC本身就是内容创作的辅助工具，通过AI和文本、绘图、视频的结合，形成了元宇宙内容创作的新生态。之所以给人此消彼长的感觉，其原因有三，表面原因是元宇宙的应用生态没有形成，如VR游戏等依然看不到突破；次要原因是流量迁移，即元宇宙的流量向ChatGPT的迁移；根本原因是资本的短期逐利性，资本来了又走，是一个阶段的结束也是另一个阶段的开始。

潜在的法律风险。一是著作权。ChatGPT生成的文学作品、代码等存在着著作权归属不清的问题。主要包括：我国现行知识产权法律体系均规定法律主体为享有权利、负有义务和承担责任的人。

二是可能助长信息网络犯罪活动罪。所谓帮信罪，即帮助信息网络犯罪活动罪，我国《刑法》第二百八十七条明确规定，明知他人利用信息网络实施犯罪，为其犯罪提供互联网接入、服务器托管、网络存储、通信传输等技术支持，或者提供广告推广、支付结算等帮助。比如，犯罪分子使用ChatGPT的文字生成功能，形成极具说服力的钓鱼电子邮件或消息，冒充人类或者组织骗取他人信息。

三是拒不履行信息网络安全管理义务罪。ChatGPT的运营商，作为信息发布的网络内容服务提供者，需要履行信息网络安全管理义务。若被监管部门要求责令整改，而ChatGPT的运营商无法提供有效的管理措施，致使违法信息大量传播，可能涉嫌拒不履行网络安全管理义务的违法行为。而前文提及的ChatGPT“大而不便改”的缺陷，则加大了“运营商无法提供有效的管理措施”的可能性。

潜在的未知风险。人与AI能否“和谐”相处，关键是能否达成“共识”，这是一个潜在的未知风险。例如，人类认为：人具有创造性，AI无法开展创造性工作，但AI“认为”：AI使人类的创造力大幅提升。人类认为：毕加索的画是抽象的创造性，但AI“认为”：毕加索的画风不过是一个模型，通过参数调整会生成多幅毕加索的画。人类认为：人类在利用AI扩展人的智能，但AI“认为”：AI在利用人展示它的智能。所以，当“机器宣传”的能力超过了原有的信息渠道；当AIGC产生的文字超过了人类历史积累的文字；当非人类情感的思想被机器开发出来；当AI“过度智能”变得比人类更聪明；当硅基生产力超越碳基生产力，人类如何掌握对人类文明的控制，这也是一个值得深思的哲学问题。

ChatGPT颠覆未来？技术之路与治理挑战在哪？

ChatGPT的治理

回顾人类历史，技术和伦理紧密交织，面对科林格里奇困境，笔者认为，社会伦理优先于技术创新。在新兴技术的设计和开发过程中，应优先考虑和满足为人类服务的伦理要求，最大限度利用技术创新造福人类。结合我国国情，对于AIGC的治理分为监管治理、行业自律、企业自治、全民共治四个方面。

监管治理：技术与内容并重。我国正在形成相对完善的法律体系，由《网络信息内容生态治理规定》《网络数据安全管理条例（征求意见稿）》《互联网信息服务深度合成管理规定（征求意见稿）》等政策法规强调对内容的治理；《互联网信息服务算法推荐管理规定》等强调对技术的治理，这体现了技术与内容并重的治理思路。建议在上述治理成果的基础上，进一步加强对ChatGPT内容产业与应用模型的方向性引导。

行业自律：伦理先行、统筹发展。国家新一代人工智能治理专业委员会在2021年发布了《新一代人工智能伦理规范》，提出将伦理道德融入人工智能研发和应用的全生命周期。《中国关于加强人工智能伦理治理的立场文件》中明确写到，人工智能治理应坚持伦理先行，通过制度建设、风险管控、协同共治等推进人工智能伦理监管；应加强自我约束，提高人工智能在研发过程中的算法安全与数据质量，减少偏见歧视；应提倡负责任使用人工智能，避免误用、滥用，加强公众宣传教育。建议成立行业联盟，统筹龙头企业、研究机构和标准化组织等发挥协同优势，联合制定公约、标准、指南、准则等行业制度规范，建立可信赖的AIGC技术框架、标准体系、评测机制等。

企业治理：主体责任与社会职责。《关于加强互联网信息服务算法综合治理的指导意见》明确提出强化企业主体责任。同时也需要企业践行科技向善理念、积极履行社会职责，例如，社会伦理、安全底线、内容治理等职责。建议加强企业与政府部门和行业组织的治理合作，为其提供可靠的技术能力，例如，内容审核技术能力、紧急辟谣技术能力等。

全民共治：提升防范意识，营造良性发展环境。一是深化公众对于AIGC技术滥用所带来的风险和危害的认知；二是提高广大群众对于虚假信息的鉴别能力；三是鼓励广大群众主动参与内容与传播等环节的舆论监督。全面共治，共同营造良性发展的生态。

（本文原载于《中国银行业》杂志2023年第5期）返回搜狐，查看更多

责任编辑：