一款法律 AI 助手的产品设计思考

AI与法律10mos agoupdate lida
70 0 0

一款法律 AI 助手的产品设计思考

前段时间,笔者所在公司发布了「INSSENT AI」,一款法律全领域的 AI 助手。

拓展阅读:法律 ChatGPT?INSSENT AI 来了!

产品地址:

http://lawai.craftsmandecc.com/INSSENT AI 发布后的短短两周时间里,已经发展了数千个用户,日活稳定在 100-200 人之间,而且我们还与众多真实的用户建立了联系,在这过程中收获了大量宝贵的反馈,和用户一起持续迭代这款产品。与此同时,还有非常多来自各行各业的朋友前来交流、寻求合作,甚至投资。法律人好奇,如何使用 AI 技术赋能法律行业,带来真正的生产力提升?投资人好奇,「AI+法律」有哪些不错的投资机会,是不是真的跑得通?大家都好奇,我们是怎么做的,使用了哪些技术和数据,以及如何训练?大家都好奇,我们未来的产品方向在哪里,是做领域模型还是垂直应用?……大家都有一种相似的预判,这次 AI 浪潮将会重现移动互联网的繁荣:在一个新的基础设施上,应用层的创造会被激发,新的热情会被点燃,当然 AI 本身已经足够令人兴奋。笔者也相信,新一轮 AI 引领的科技革命将会彻底改造法律行业,未来 ——每一位律师,都将熟练掌握法律 AI 工具,用以取代重复低效的工作内容,从事更高价值的法律工作;每一个组织或个体,都将把法律 AI 工具引入日常的工作流或生活中,提升法律服务可产生的经济效益,至少在简单的法律咨询环节,获得成本更低、响应速度更快且质量不错的服务;中国乃至全球的法律行业,都将通过 AI 得到更好的发展,获得更大的想象空间。然而,对于这一轮 AI 革命将会如何改造法律行业,以及如何到达那个未来,大家的想法和采取的实现路径并不相同。INSSENT AI 是国内最早一批正式推出的法律 AI 助手,随后一些厂商也陆续推出类似产品以及其他领域的应用,可以说是百花齐放,但如果对此深入剖析,现阶段的「AI+法律」市场也可以说是良莠不齐。和过去一样,一个重要的新技术出现之后,总会伴随着一些没什么价值的尝试,总是有一些人会把还不成熟的 ChatGPT套壳产品作为灵丹妙药进行炒作营销历史总是很相似。作为 INSSENT AI 主创团队之一,笔者可以分享一下本人对「AI+法律」在私人助手领域落地的思考,但不代表 INSSENT AI 官方,毕竟在一个新时代的前夜,大量产品方向尚不明确,我们也仍在探索中。

AI+法律」

在私人助手场景的落地应用

首先,「AI+法律」,就像十年前的“互联网+法律”,以及近年来兴起的“法律科技”概念一样,是一个非常大的范畴,本质上是一个新科技在法律这个垂直领域的落地。而 INSSENT AI,则是 AI 技术在「法律领域」和「私人助手」这个细分场景的应用。

众所周知,一款产品不可能解决所有问题。因此,INSSENT AI「私人法律助手」的产品定位,其实已经在一定程度上明确了产品的边界。比如它不是专业级的法律检索数据库,也不是专业级的合同起草或审查系统,更不是为了替代律师,至少不是资深律师。那么,人们可能需要一个「私人法律助手」做什么呢?我们知道,人们想要解决法律问题,通常有几种方式:直接咨询律师,或者在搜索引擎/内容平台上搜索/提问法律问题后自行解决,但现阶段往往最后还是要咨询律师,毕竟没有法律专业背景的人很难提出精准的问题,而且法律问题和别的问题不一样,与人身、财产强相关,为此人们会更加谨慎。这个洞察具有一定的数据支撑。众所周知,百度是历史上最悠久的中文搜索引擎之一,20 多年的发展,中国绝大多数人都使用百度搜索过问题,其中就包括法律问题。根据笔者的研究,每个月,人们在百度上搜索法律问题使用最高频、热度攀升最快的搜索关键词,不是特定的法律专业问题,而是“律师免费咨询”。因此,还是真实的律师靠谱。人人都想认识一个律师朋友。但是,就像福特汽车的创始人福特先生所说:“如果我最初问消费者他们想要什么,他们会告诉我‘要一匹更快的马’!”一样,人们并不是真正想要一匹更快的马,而是想要「更快的交通工具」。同理,人们也不是真正想要咨询律师,而是希望「更好地解决法律问题」。

AI+法律」

使法律服务出现新范式成为可能

传统意义上,当人们想解决一个法律问题,常见的解决方案就是律师或法律咨询机构,但随着互联网的发展,解决方案逐渐多元。

区分人们寻求法律解决方案的方式,我们可以把法律服务的需求方大概分为以下两类:

第一类用户遇到法律问题会先去搜索相关信息,尝试自己解决,解决不了的时候再去找律师或法律咨询机构解决;

第二类用户遇到问题直接找律师解决。

虽然没有具体的数据支撑,但凭直觉判断,现阶段肯定是第二类用户占大多数,第一类用户还比较少,但正在慢慢增多,而这部分用户就是以 80 后、90 后为代表的第一代互联网原住民,再加上普法工作的持续推进和获取信息的门槛持续降低,学习法律知识、在线法律咨询的趋势将会加速

在这个过程中,人们解决法律问题的需求是不变的,但随着技术的发展,肯定会带来新的解决方案。

那么,这个新的解决方案可能是什么呢?

首先,我们先来分解一下原来的解决方案 —— 律师,到底提供了什么价值?

挖掘、梳理客户需求,即根据律师的所学和过往的经验进行提问、归纳和总结

提供相法律服务,包括简单的法律咨询和文件起草工作,以及更复杂的谈判、出庭等“人”的因素占主要作用的工作

作为“人”与客户之间的信任关系

与此同时还要考虑以下几个因素:成本:虽然近年来行业出现一些低价竞争的情况,但总体上律师费还是挺高的。专业性:律师的专业能力参差不齐,不一定能解决客户的问题,但法律服务缺少好的评判标准,导致专业性的需求被掩盖,但这并不意味着这个需求没有了。当然,有时候专业性也不是最重要的。信息不对称:由于律师行业缺少科学或合理的律师评价体系,客户在专业能力参差不齐的市场上很难找到适合自己的律师。于是就出现了很多律师没客户,同时客户也找不到合适律师的情况。那么,在新的科技水平下,可能会出现一个新的解决方案,可以帮助客户挖掘、梳理需求,甚至进一步提供法律服务,同时成本更低、专业性更高、更稳定。现在我们知道,在大模型取得突破后,这是很有可能的,也就是法律 AI 助手。与此同时,如果这个解决方案不是“人”,而是“机器”,其实也会在一定程度上解决律师行业信息不对称的问题。

打造一款法律 AI 助手的难点

然而,正如 OKR 之父约翰•杜尔所说:“Ideas are easy. Execution is everything.” 想法很简单,执行才是一切。

笔者认为,人类对法律 AI 助手的期待,或者说最期待的获取法律知识的方式,就是像和人一样交流 —— 向专业的人,问专业的事,解决专业的问题。在未来,“专业的人”将会无处不在,也就是智能机器人。

但是,由于法律行业的特殊性,人们对法律服务的专业性天然有很高的要求,就像人们都希望得到资深律师或资深医生服务一样,人们对法律 AI 助手的期待亦是如此。

这就意味着,如果我们想要打造一款法律 AI 私人助手,那么这款产品的专业性和回答的准确度就至关重要了,像 ChatGPT 会出现的“幻觉”是绝对不允许出现的。

所以要想打造一款法律 AI 助手,至少会面临以下几个难题:

第一:法律数据的数量不足。

首先,我们需要对 AI 有一个基础的认知,即 AI 主要由三个基本要素组成:算力、算法、数据,缺一不可。

其中,算力的核心是芯片,全世界都吃紧,操心也没用,算法目前都是基于市面上领先的大模型,以 Transformer 架构为主,而大模型的突破除了架构本身的问题,大数据也起到了很大的作用。

然而,虽然以 ChatGPT 为代表的大模型使用了海量的数据进行预训练,但在垂直领域,比如法律行业,数据仍然非常缺乏。即便是业内公开的数据源 —— 司法裁判文书,已经上网的有 1.4 亿份,但与 GPT-3 及以上的大模型超过 1 万亿的参数量相比,根本就不在一个量级,而且从目前来看,算力的问题也不太可能支持每个领域都有一个基础模型。

所以,法律“大模型”,可能并不成立。

同时还要区分不同场景,每一个场景都需要大量数据进行训练,才能使 AI 在某些场景变得智能,否则如果只是给 ChatGPT 套个壳,并不会带来实质性的提升。

比如「智能合同审查」这个场景,只有用某个领域、足够多、真实的合同,对算法进行训练,才有可能实现所谓的智能合同审查。这就意味着,你必须服务足够多的客户,而且这是现阶段唯一可行的路径。因为客户不可能把机密的合同数据随便开放给你,首先数据权属尚不清晰,其次即便国家出台了相应的法律法规,企业对使用数据的态度转变也需要相当漫长的时间。

因此,如果一家公司压根就没做过几家合同审查的客户,突然推出了一款“智能合同审查产品”,那么大概率就是给类 ChatGPT 产品套个壳,并不是真的智能合同审查。

顺着这个框架去思考,对于很多所谓的“AI+法律”产品是不是真的,其实很容易就能判断清楚了。

第二:法律数据的质量也不高。

由于人们对法律服务专业性的高要求,AI 在法律领域落地所需的法律数据的质量要求,就比训练大模型要高得多的多。

目前市面上领先的大模型 —— GPT-4 的参数量超过 1 万亿,对于大模型来说,数据量级比数据质量更重要,这使得 ChatGPT 更加智能,但也可能是“幻觉”(hallucinating,指 AI 编造事实)问题出现的原因之一。

对于法律行业来说,业内公开的数据源 —— 司法裁判文书,已经上网的有 1.4 亿份,数据量似乎很大,法律问答、文章、期刊文献也很多,但数据质量未必很高。

事实上,人们对「大数据」普遍存在误解,觉得「大数据」就等于数量大,其实不然。大数据至少包含以下四个维度:

数量大

维度多且最好是正交的

完备性

实时性

只有同时具备以上四个维度,才能最大限度地发挥数据的价值,毕竟大数据本质上是个统计学的问题。

因此,法律行业的很多数据的质量都不高,都需要一定程度的处理:司法裁判文书:数量大,但维度有限,不完备也不实时 —— 并不是所有文书都上网了,也不是实时更新的,文书依据的法律可能被修改或废止,但文书不会自动修正,而且我国统一法律适用也不成熟。法律问答、文章、期刊文献等:从本质上看,绝大多数的法律问答、文章、期刊文献都没有太大的价值,因为法律服务市场理论上存在最好的服务,由各个领域的头部法律服务机构提供。就像合同模板库这个概念一样,每个业务领域理论上只存在一份最完善的合同模板,覆盖几乎所有场景,而且这份模板只能是服务足够多客户的机构推出的,因为这个机构见过足够多的问题,因此绝大多数律师提供的模板都没有太大的价值。只是国内的法律服务市场还很初级,很多律师提供的文本看起来也很有价值,但未来必然会面临整合。因此,如果直接使用这些公开的数据,那么机器回答法律问题就肯定不够专业和准确。这就意味着,只要追求专业性,法律服务就必然会趋同,从而泯灭多样性。虽然在法律行业,专业性有时候并不是最重要的,可以解决问题的方法也不只有少数几种,但这并不妨碍用户想要最专业的解决方案。正如笔者在《法律 ChatGPT?INSSENT AI 来了!》中写道:与目前主流的 AI 应用场景 —— AIGC(即 AI 生产内容)不同的是,易参设计 INSSENT AI 的总体思路是:打造一个能给出靠谱法律意见的助手,每一条输出后面,都可以明确地指向某一个法律法规的条文或者案例,让你知道来源是靠谱的,而不是一本正经地胡说八道。综上所述,AI 在法律领域的落地,本质上是要解决小样本学习的问题。至于机器如何更好地理解用户的问题,并且能够像律师一样,为了帮助用户明确问题而进行多轮追问,除了大模型本身需要持续进步以外,关键就是如何用好数据,以及根据新的交互方式,重组我们的知识体系。

AI 发展的几个不同范式

具体到技术实现路径上,也还没有共识。

目前,不论是在学术界还是工业界,对于 AI 的发展路径存在几个不同范式的讨论:直接训练不同垂直领域的 foundation model(基础模型)对大语言模型(LLM)进行“微调”(fine-tuning)通过 Hugging-GPT、Auto-GPT、ChatGPT-Plugin 等“代理”(agent)应用,以大模型为大脑,调用各种专家模型(比如法律)来解决问题这几个发展路径都有很多机会和挑战:首先,直接训练不同垂直领域的 foundation model(基础模型),最垂直、最专业,但大概率不够智能,而且成本非常高。其次,对大模型进行“微调”(fine-tuning),可以使用大模型的能力,但可能会导致大模型学到了新的知识,却丢掉了旧的知识或原有能力(如推理和理解能力),特别是当微调的领域需要非常强的推理(reasoning)能力的时候,微调就不是非常好的选项 —— 虽然未来可能会找到比较好的办法,但现阶段还是比较难。通过 Hugging-GPT、Auto-GPT、ChatGPT-Plugin 等“代理”(agent)应用,以大模型为大脑,调用各种专家模型来解决问题,优势是可以解决数据合规的问题,因为不需要把数据上传给大模型预训练或微调。但“代理”这个范式的问题是,一方面依赖大模型本身的理解、任务拆解和调度等能力的提升,而且目前大模型在垂直领域是否有足够强的泛化能力(generalization ability,指算法对新样本的适应能力)还是个问题,另一方面也需要建立专家模型生态,专家模型的供给需要足够丰富。只有同时具备以上几个条件,这个生态才有可能转起来。在这个范式下,AI 创新要想赢得市场,生态可能比技术更重要。以上三个发展路径,似乎都 make sense,但也都需要探索。换句话说,AI 在垂直领域的落地,目前还要解决很多科学问题,还没到拼工程能力的阶段。

大多数法律 AI 产品都还很初级

但整个行业的天花板会不断提高

一直以来新技术都是博取眼球的噱头。可以预见的是,炒作法律 AI 概念的产品未来会越来越多,很多人会因此感到焦虑。

众所周知,目前 AI 最成熟的应用场景就是 AI 生成内容,但在缺乏数据的垂直领域,只要关键词写得足够准确,向 ChatGPT 提问和在搜索引擎上搜索并不会带来明显的效率提升 —— 广告太多从来都不是核心问题。比如有人会问:“如何使用 ChatGPT 来生成合同?”这个问题就很奇怪,为什么要用 ChatGPT 来生成合同?直接使用合同模板库不就行了?即便 ChatGPT 可以生成专业且严谨的合同,为此你需要写个几百字精准的 prompt(提示词),然后对生成的结果进行多轮修正,有这功夫,为什么不花个十几分钟,直接调用合同模板库的模板和条款?这不是更快么?何况 ChatGPT 还做不到。一个并不智能的产品,自然不能带来多大的生产力提升。都是炒作而已。所以,为什么要用 ChatGPT 来生成合同?为了显得自己很“技术派”?这种盲目追风的现象,就是典型的「FOMO」的表现。注:FOMO,Fear of Missing Out,中文可以叫:错失恐惧症,也称为社群恐慌症。指的是人们害怕错过任何有趣或重要的事情,以至于经常感到焦虑和不安。在这个社交媒体和数字化时代,FOMO 现象变得是如此普遍,因为人们通过社交媒体可以看到其他人的生活和活动,并且会担心自己可能会错过一些与之相关的体验或事件。同时,FOMO 也被定义为一种对后悔的恐惧,而这种恐惧使得你情不自禁地陷入到对错失结交社会关系、获取新奇经历、投资机遇或是其它事情的忧虑中。

正如过去几次科技革命一样,数字化浪潮滚滚向前,无可阻挡,各行各业终将被技术或多或少地改造,市场天花板也会不断提高。

但对于创业者来说,对趋势和时机的判断也很重要 —— 由于种种现实原因,科技并不能解决所有问题。这也是最容易被忽视的。

-FIN-

点击关注「法律修音机」,你将感受到一个朋克的灵魂,且每篇文章都有惊喜。

© Copyright notes

Related posts

No comments

No comments...