一款法律 AI 助手的产品设计思考

AI与法律2yrs ago (2024)update lida

138 0 0

一款法律 AI 助手的产品设计思考

前段时间，笔者所在公司发布了「INSSENT AI」，一款法律全领域的 AI 助手。

产品地址：

http://lawai.craftsmandecc.com/INSSENT AI 发布后的短短两周时间里，已经发展了数千个用户，日活稳定在 100-200 人之间，而且我们还与众多真实的用户建立了联系，在这过程中收获了大量宝贵的反馈，和用户一起持续迭代这款产品。与此同时，还有非常多来自各行各业的朋友前来交流、寻求合作，甚至投资。法律人好奇，如何使用 AI 技术赋能法律行业，带来真正的生产力提升？投资人好奇，「AI+法律」有哪些不错的投资机会，是不是真的跑得通？大家都好奇，我们是怎么做的，使用了哪些技术和数据，以及如何训练？大家都好奇，我们未来的产品方向在哪里，是做领域模型还是垂直应用？……大家都有一种相似的预判，这次 AI 浪潮将会重现移动互联网的繁荣：在一个新的基础设施上，应用层的创造会被激发，新的热情会被点燃，当然 AI 本身已经足够令人兴奋。笔者也相信，新一轮 AI 引领的科技革命将会彻底改造法律行业，未来 ——每一位律师，都将熟练掌握法律 AI 工具，用以取代重复低效的工作内容，从事更高价值的法律工作；每一个组织或个体，都将把法律 AI 工具引入日常的工作流或生活中，提升法律服务可产生的经济效益，至少在简单的法律咨询环节，获得成本更低、响应速度更快且质量不错的服务；中国乃至全球的法律行业，都将通过 AI 得到更好的发展，获得更大的想象空间。然而，对于这一轮 AI 革命将会如何改造法律行业，以及如何到达那个未来，大家的想法和采取的实现路径并不相同。INSSENT AI 是国内最早一批正式推出的法律 AI 助手，随后一些厂商也陆续推出类似产品以及其他领域的应用，可以说是百花齐放，但如果对此深入剖析，现阶段的「AI+法律」市场也可以说是良莠不齐。和过去一样，一个重要的新技术出现之后，总会伴随着一些没什么价值的尝试，总是有一些人会把还不成熟的 ChatGPT 的套壳产品作为灵丹妙药进行炒作营销。历史总是很相似。作为 INSSENT AI 主创团队之一，笔者可以分享一下本人对「AI+法律」在私人助手领域落地的思考，但不代表 INSSENT AI 官方，毕竟在一个新时代的前夜，大量产品方向尚不明确，我们也仍在探索中。

「AI+法律」

在私人助手场景的落地应用

首先，「AI+法律」，就像十年前的“互联网+法律”，以及近年来兴起的“法律科技”概念一样，是一个非常大的范畴，本质上是一个新科技在法律这个垂直领域的落地。而 INSSENT AI，则是 AI 技术在「法律领域」和「私人助手」这个细分场景的应用。

众所周知，一款产品不可能解决所有问题。因此，INSSENT AI「私人法律助手」的产品定位，其实已经在一定程度上明确了产品的边界。比如它不是专业级的法律检索数据库，也不是专业级的合同起草或审查系统，更不是为了替代律师，至少不是资深律师。那么，人们可能需要一个「私人法律助手」做什么呢？我们知道，人们想要解决法律问题，通常有几种方式：直接咨询律师，或者在搜索引擎/内容平台上搜索/提问法律问题后自行解决，但现阶段往往最后还是要咨询律师，毕竟没有法律专业背景的人很难提出精准的问题，而且法律问题和别的问题不一样，与人身、财产强相关，为此人们会更加谨慎。这个洞察具有一定的数据支撑。众所周知，百度是历史上最悠久的中文搜索引擎之一，20 多年的发展，中国绝大多数人都使用百度搜索过问题，其中就包括法律问题。根据笔者的研究，每个月，人们在百度上搜索法律问题使用最高频、热度攀升最快的搜索关键词，不是特定的法律专业问题，而是“律师免费咨询”。因此，还是真实的律师靠谱。人人都想认识一个律师朋友。但是，就像福特汽车的创始人福特先生所说：“如果我最初问消费者他们想要什么，他们会告诉我‘要一匹更快的马’！”一样，人们并不是真正想要一匹更快的马，而是想要「更快的交通工具」。同理，人们也不是真正想要咨询律师，而是希望「更好地解决法律问题」。

「AI+法律」

使法律服务出现新范式成为可能

传统意义上，当人们想解决一个法律问题，常见的解决方案就是律师或法律咨询机构，但随着互联网的发展，解决方案逐渐多元。

区分人们寻求法律解决方案的方式，我们可以把法律服务的需求方大概分为以下两类：

第一类用户遇到法律问题会先去搜索相关信息，尝试自己解决，解决不了的时候再去找律师或法律咨询机构解决；

第二类用户遇到问题直接找律师解决。

虽然没有具体的数据支撑，但凭直觉判断，现阶段肯定是第二类用户占大多数，第一类用户还比较少，但正在慢慢增多，而这部分用户就是以 80 后、90 后为代表的第一代互联网原住民，再加上普法工作的持续推进和获取信息的门槛持续降低，学习法律知识、在线法律咨询的趋势将会加速。

在这个过程中，人们解决法律问题的需求是不变的，但随着技术的发展，肯定会带来新的解决方案。

那么，这个新的解决方案可能是什么呢？

首先，我们先来分解一下原来的解决方案 —— 律师，到底提供了什么价值？

挖掘、梳理客户需求，即根据律师的所学和过往的经验进行提问、归纳和总结

提供相法律服务，包括简单的法律咨询和文件起草工作，以及更复杂的谈判、出庭等“人”的因素占主要作用的工作

作为“人”与客户之间的信任关系

‍‍

与此同时还要考虑以下几个因素：成本：虽然近年来行业出现一些低价竞争的情况，但总体上律师费还是挺高的。专业性：律师的专业能力参差不齐，不一定能解决客户的问题，但法律服务缺少好的评判标准，导致专业性的需求被掩盖，但这并不意味着这个需求没有了。当然，有时候专业性也不是最重要的。‍‍‍信息不对称：由于律师行业缺少科学或合理的律师评价体系，客户在专业能力参差不齐的市场上很难找到适合自己的律师。于是就出现了很多律师没客户，同时客户也找不到合适律师的情况。那么，在新的科技水平下，可能会出现一个新的解决方案，可以帮助客户挖掘、梳理需求，甚至进一步提供法律服务，同时成本更低、专业性更高、更稳定。现在我们知道，在大模型取得突破后，这是很有可能的，也就是法律 AI 助手。与此同时，如果这个解决方案不是“人”，而是“机器”，其实也会在一定程度上解决律师行业信息不对称的问题。

打造一款法律 AI 助手的难点

然而，正如 OKR 之父约翰•杜尔所说：“Ideas are easy. Execution is everything.” 想法很简单，执行才是一切。

笔者认为，人类对法律 AI 助手的期待，或者说最期待的获取法律知识的方式，就是像和人一样交流 —— 向专业的人，问专业的事，解决专业的问题。在未来，“专业的人”将会无处不在，也就是智能机器人。

但是，由于法律行业的特殊性，人们对法律服务的专业性天然有很高的要求，就像人们都希望得到资深律师或资深医生服务一样，人们对法律 AI 助手的期待亦是如此。

这就意味着，如果我们想要打造一款法律 AI 私人助手，那么这款产品的专业性和回答的准确度就至关重要了，像 ChatGPT 会出现的“幻觉”是绝对不允许出现的。

所以要想打造一款法律 AI 助手，至少会面临以下几个难题：

第一：法律数据的数量不足。

首先，我们需要对 AI 有一个基础的认知，即 AI 主要由三个基本要素组成：算力、算法、数据，缺一不可。

其中，算力的核心是芯片，全世界都吃紧，操心也没用，算法目前都是基于市面上领先的大模型，以 Transformer 架构为主，而大模型的突破除了架构本身的问题，大数据也起到了很大的作用。

然而，虽然以 ChatGPT 为代表的大模型使用了海量的数据进行预训练，但在垂直领域，比如法律行业，数据仍然非常缺乏。即便是业内公开的数据源 —— 司法裁判文书，已经上网的有 1.4 亿份，但与 GPT-3 及以上的大模型超过 1 万亿的参数量相比，根本就不在一个量级，而且从目前来看，算力的问题也不太可能支持每个领域都有一个基础模型。

所以，法律“大模型”，可能并不成立。

同时还要区分不同场景，每一个场景都需要大量数据进行训练，才能使 AI 在某些场景变得智能，否则如果只是给 ChatGPT 套个壳，并不会带来实质性的提升。

比如「智能合同审查」这个场景，只有用某个领域、足够多、真实的合同，对算法进行训练，才有可能实现所谓的智能合同审查。这就意味着，你必须服务足够多的客户，而且这是现阶段唯一可行的路径。因为客户不可能把机密的合同数据随便开放给你，首先数据权属尚不清晰，其次即便国家出台了相应的法律法规，企业对使用数据的态度转变也需要相当漫长的时间。

因此，如果一家公司压根就没做过几家合同审查的客户，突然推出了一款“智能合同审查产品”，那么大概率就是给类 ChatGPT 产品套个壳，并不是真的智能合同审查。

顺着这个框架去思考，对于很多所谓的“AI+法律”产品是不是真的，其实很容易就能判断清楚了。

第二：法律数据的质量也不高。

由于人们对法律服务专业性的高要求，AI 在法律领域落地所需的法律数据的质量要求，就比训练大模型要高得多的多。

目前市面上领先的大模型 —— GPT-4 的参数量超过 1 万亿，对于大模型来说，数据量级比数据质量更重要，这使得 ChatGPT 更加智能，但也可能是“幻觉”（hallucinating，指 AI 编造事实）问题出现的原因之一。

对于法律行业来说，业内公开的数据源 —— 司法裁判文书，已经上网的有 1.4 亿份，数据量似乎很大，法律问答、文章、期刊文献也很多，但数据质量未必很高。

事实上，人们对「大数据」普遍存在误解，觉得「大数据」就等于数量大，其实不然。大数据至少包含以下四个维度：

数量大

维度多且最好是正交的

完备性

实时性

只有同时具备以上四个维度，才能最大限度地发挥数据的价值，毕竟大数据本质上是个统计学的问题。

因此，法律行业的很多数据的质量都不高，都需要一定程度的处理：司法裁判文书：数量大，但维度有限，不完备也不实时 —— 并不是所有文书都上网了，也不是实时更新的，文书依据的法律可能被修改或废止，但文书不会自动修正，而且我国统一法律适用也不成熟。法律问答、文章、期刊文献等：从本质上看，绝大多数的法律问答、文章、期刊文献都没有太大的价值，因为法律服务市场理论上存在最好的服务，由各个领域的头部法律服务机构提供。就像合同模板库这个概念一样，每个业务领域理论上只存在一份最完善的合同模板，覆盖几乎所有场景，而且这份模板只能是服务足够多客户的机构推出的，因为这个机构见过足够多的问题，因此绝大多数律师提供的模板都没有太大的价值。只是国内的法律服务市场还很初级，很多律师提供的文本看起来也很有价值，但未来必然会面临整合。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍因此，如果直接使用这些公开的数据，那么机器回答法律问题就肯定不够专业和准确。这就意味着，只要追求专业性，法律服务就必然会趋同，从而泯灭多样性。虽然在法律行业，专业性有时候并不是最重要的，可以解决问题的方法也不只有少数几种，但这并不妨碍用户想要最专业的解决方案。正如笔者在《法律 ChatGPT？INSSENT AI 来了！》中写道：与目前主流的 AI 应用场景 —— AIGC（即 AI 生产内容）不同的是，易参设计 INSSENT AI 的总体思路是：打造一个能给出靠谱法律意见的助手，每一条输出后面，都可以明确地指向某一个法律法规的条文或者案例，让你知道来源是靠谱的，而不是一本正经地胡说八道。综上所述，AI 在法律领域的落地，本质上是要解决小样本学习的问题。至于机器如何更好地理解用户的问题，并且能够像律师一样，为了帮助用户明确问题而进行多轮追问，除了大模型本身需要持续进步以外，关键就是如何用好数据，以及根据新的交互方式，重组我们的知识体系。

AI 发展的几个不同范式

具体到技术实现路径上，也还没有共识。

目前，不论是在学术界还是工业界，对于 AI 的发展路径存在几个不同范式的讨论：直接训练不同垂直领域的 foundation model（基础模型）对大语言模型（LLM）进行“微调”（fine-tuning）通过 Hugging-GPT、Auto-GPT、ChatGPT-Plugin 等“代理”（agent）应用，以大模型为大脑，调用各种专家模型（比如法律）来解决问题这几个发展路径都有很多机会和挑战：首先，直接训练不同垂直领域的 foundation model（基础模型），最垂直、最专业，但大概率不够智能，而且成本非常高。其次，对大模型进行“微调”（fine-tuning），可以使用大模型的能力，但可能会导致大模型学到了新的知识，却丢掉了旧的知识或原有能力（如推理和理解能力），特别是当微调的领域需要非常强的推理（reasoning）能力的时候，微调就不是非常好的选项 —— 虽然未来可能会找到比较好的办法，但现阶段还是比较难。通过 Hugging-GPT、Auto-GPT、ChatGPT-Plugin 等“代理”（agent）应用，以大模型为大脑，调用各种专家模型来解决问题，优势是可以解决数据合规的问题，因为不需要把数据上传给大模型预训练或微调。但“代理”这个范式的问题是，一方面依赖大模型本身的理解、任务拆解和调度等能力的提升，而且目前大模型在垂直领域是否有足够强的泛化能力（generalization ability，指算法对新样本的适应能力）还是个问题，另一方面也需要建立专家模型生态，专家模型的供给需要足够丰富。只有同时具备以上几个条件，这个生态才有可能转起来。在这个范式下，AI 创新要想赢得市场，生态可能比技术更重要。以上三个发展路径，似乎都 make sense，但也都需要探索。换句话说，AI 在垂直领域的落地，目前还要解决很多科学问题，还没到拼工程能力的阶段。‍‍

大多数法律 AI 产品都还很初级

但整个行业的天花板会不断提高

一直以来新技术都是博取眼球的噱头。可以预见的是，炒作法律 AI 概念的产品未来会越来越多，很多人会因此感到焦虑。

众所周知，目前 AI 最成熟的应用场景就是 AI 生成内容，但在缺乏数据的垂直领域，只要关键词写得足够准确，向 ChatGPT 提问和在搜索引擎上搜索并不会带来明显的效率提升 —— 广告太多从来都不是核心问题。比如有人会问：“如何使用 ChatGPT 来生成合同？”这个问题就很奇怪，为什么要用 ChatGPT 来生成合同？直接使用合同模板库不就行了？即便 ChatGPT 可以生成专业且严谨的合同，为此你需要写个几百字精准的 prompt（提示词），然后对生成的结果进行多轮修正，有这功夫，为什么不花个十几分钟，直接调用合同模板库的模板和条款？这不是更快么？何况 ChatGPT 还做不到。一个并不智能的产品，自然不能带来多大的生产力提升。都是炒作而已。所以，为什么要用 ChatGPT 来生成合同？为了显得自己很“技术派”？这种盲目追风的现象，就是典型的「FOMO」的表现。注：FOMO，Fear of Missing Out，中文可以叫：错失恐惧症，也称为社群恐慌症。指的是人们害怕错过任何有趣或重要的事情，以至于经常感到焦虑和不安。在这个社交媒体和数字化时代，FOMO 现象变得是如此普遍，因为人们通过社交媒体可以看到其他人的生活和活动，并且会担心自己可能会错过一些与之相关的体验或事件。同时，FOMO 也被定义为一种对后悔的恐惧，而这种恐惧使得你情不自禁地陷入到对错失结交社会关系、获取新奇经历、投资机遇或是其它事情的忧虑中。