AI与法律：基于规则、机器学习和表示学习的应用探索

AI与法律2yrs ago (2024)update lida

148 0 0

文章主题：作者, 梅林, 深圳维智信息科技有限公司创始人, 人工智能

作者 | 梅林（深圳维智信息科技有限公司创始人）

在人工智能浪潮的推动下，法律领域也开始广泛应用这项技术，各类机器人律师的报道频繁出现，引人注目。作为一名和法律行业密切相关的理工男，我已经在这个领域投入了两年时间的研究和实践，对人工智能和法律都有了一定的了解。我想借这篇文章，与大家一起探讨这个领域的未来发展和可能的影响。

●基于规则的系统●

广义上，人工智能（AI）是指利用计算机模拟并实现人类智能的技术。它可以自动执行各种任务，其基本操作就是接收输入，经过运算处理后，输出结果。举例来说，案例检索系统就是一个典型的应用，用户输入关键词，系统接收到请求后，迅速地进行运算和匹配，最后返回相关案例作为输出。相比人类大脑，电脑在遵循固定规则生成输出时表现出更高的效率，这使得在AI发展的初期，人们对于AI的未来发展抱有极大的期望。

自20世纪50年代起，基于规则的系统研究便已启动，而在法律领域的相关研究则更早展开。然而，为了建立这类系统，需要大量人工设计规则，这无疑耗费了巨大的人力。在一个领域中，往往需要数十名研究人员经过数年的不懈努力，才能够构建出一个较为完善的体系。然而，用户在使用这些系统时却感到十分繁琐，因此它们的使用范围逐渐缩小，尤其在国外法律界，主要应用于一些行政机构。我认为这一现象的原因可能有以下几点：首先，政府部门通常拥有充足的资金支持，因此用户体验并非关键因素。其次，在当时的阶段，许多专家试图通过逻辑建模的方式模拟法律推理过程，但收效甚微。这并非不可理解，因为即使是人类大脑，对于法律推理的过程也缺乏有效的公式化表述。

●机器学习●

这种系统的认知水平远未达到人类的标准，例如在识别图片中的物体时，人类能够轻松地辨认出其中的猫，并理解自己是如何做到这一点的，然而要让机器实现这一目标却相当困难。为了完成这类任务，机器必须具备自我获取知识的能力，类似于人类通过视觉系统来学习识别物体。换言之，目前这种系统在认知方面尚无法与人类相提并论，因此在应对复杂任务时仍存在明显的局限性。

我们继续讨论AI系统，特别是那些在特定任务中不明确规则的情况。在这里，我们关注的是规则本身以及它们所影响到的特性。举例来说，若要定义一辆汽车，尽管我们不知道各部件之间的组合规律，但我们可以清楚地认识到汽车是由轮子、发动机等组成部分构成的。在这种情况下，我们可以借助大量样本，使机器自主学习汽车各部件如何共同构成了一个整体。这个过程正是典型的机器学习，即手动输入特性，然后让机器自动探索如何从中生成输出。

在法律领域中，案例检索是一个关键环节，如何选择适当的关键词是其中一个重要问题。这个过程实际上涉及到将口语化的案件信息转化为法律术语关键词的过程。用户可能会采用非法律专业术语或口语化的方式来输入信息。例如，假设我们有1万个房产纠纷的例子，每个例子都通过打标签的方式与相应的法律术语关联起来。借助机器学习技术，我们可以分析这些例子，并确定哪些表述映射到了哪些法律术语上。然后，将这些法律术语输出给传统的案例检索系统，从而构建一个具有自学习能力的人工智能案例检索系统。同样地，这个原理也可以应用于自动法律咨询服务系统中。

●表示学习●

但是显而易见的是，在很多任务中，特征的选定本身就是一件不可能完成的任务，法律领域大小案由800多个，每个案由又有自己独特的特征，全部由人工挑选实在是一个巨大的工程，那么问题来了，选定特征这个步骤是不是也可以由机器自动学习到呢？这一轮的人工智能热潮正是因为人工智能技术在特征识别上取得了重大的突破，关键就是这两年媒体频繁提到的深度学习。目前深度学习在【图片识别、语音识别和自然语言处理】上都取得了很多“黑科技”般的成功，很多成功背后都是通过卷积神经网络和循环神经网络办到的，在我的工作中这两个算法在法律文本分类、法律文本自动生成、自然语言案例检索上都有十分亮眼的表现。由于这类算法是学习到如何用特征来表示，我们可以称其为表示学习。

以上总结了人工智能的大致的类型，包括：基于规则的系统、经典机器学习、表示学习。在如今法律加人工智能行业中采用这三种的都有，我建议从业者们尽快将自己的算法更新到深度学习算法上，不要耗费精力在过时的基于规则的系统上，毕竟这是国外上世纪六七十年代研究的东西，而经典机器学习，在很多任务上还有很不错的表现，并不是完全落伍了。

●法律界的应用●

下面我们重点分析一下表示学习在法律界的应用，由于这个领域很新，所以只能做一下初略的分析。在法律领域，有一个和其它领域不同的地方，在这个领域中，普通人和专业法律人士之间有一个巨大的鸿沟，所以研究领域变成了两个分支，一个是解决普通人和法律专业人士之间不透明度的问题；一个是专业人士的法律研究问题。

针对普通人的产品主要是通俗的自然语言输入到法律要素的映射问题，由于普通人并不需要研究很复杂的法律问题，所以只需要通过AI定位到问题，并给出简洁的答案，或者推荐专业人士即可，典型的产品就是自动法律咨询。在这种应用中我们可以以裁判文书为素材，利用深度学习来训练语言模型，由于裁判文书中的诉求答辩部分有很多通俗表述，裁判理由部分又有很多专业术语表述，所以可以学习到两种语言表述的特点，也就是自动学习了近义词，我们只需要列举常见的法律问题并给出答案，从用户的输入到常见问题的过程可以通过表示学习自动完成。

而针对法律研究的产品，典型的有案例检索，可以通过和上述同样的方法实现完全自然语言输入的案例检索。有一些人在尝试案件结果预判，个人认为由于目前的裁判文书并不能反应案件的所有特征，所以自动学习恐怕无法实现结果预判，有人尝试迂回策略，将结果预判转换成大数据分析的问题，根据特征找到类似案例，然后统计类似案例的结果，但是这个做法的缺陷在于胜诉率80%对用户来说其实没有什么用，无法用来指导用户的行为和决策。我觉得找到最接近的案例并自动摘要出案例的关键信息可能会起到更大的作用。另外，类似自然语言案例检索的技术的核心是自动抽取文档中的关键信息，可以应用的领域很多，比如自动合同审查、尽职调查中的重点标注等。我还试验过自动生成法律文书，人自己开个头，剩下的电脑自动生成，目前生成的文书语句通顺，但是在目标性方面还需要优化。

总结一下，人工智能在法律领域可应用的点很多，但是我觉得最值得投入的是表示学习，可以开发出一些“黑科技”产品。作为做人工智能应用的从业人士，我们不必研究新的算法，但是可以多了解有哪些新的算法产生，原理和应用方法是什么，以避免在错误的地方浪费资源。

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！