11月15日,最高人民法院举行新闻发布会,发布了“法信法律基座大模型”。《法治日报》记者从发布会上了解到,“法信法律基座大模型”定位于国内法治领域“行业基座”大模型,并已于10月21日完成在网信部门的生成式人工智能服务备案。
“法信法律基座大模型”是最高法积极探索使用人工智能技术为司法赋能,推动人工智能与司法工作深度融合的重要成果,将立足国家级法律人工智能基础设施这一关键定位,广泛赋能司法审判、行政执法和公共法律服务等领域。
起基础支撑作用的可靠可控大模型
“‘法信法律基座大模型’是在清华大学科研成果转化的千亿参数通用大模型基座上,投入最高法‘法信’等多个法律大数据平台经过高质量专业标注的3.2亿篇共计3.67万亿字的法律文献、裁判、案例、观点等数据语料,融入人民法院电子音像出版社历时十余年搭建的包含18万法律知识体系编码的‘法信大纲’,在各级法院、科研机构和科技企业的共同努力下,经过为期数月的预训练、优化训练、监督微调和多轮测评,形成的研发成果。”人民法院出版社总编辑余茂玉介绍了研发建设背景和进展情况。
“法信法律基座大模型”为何被称为法律行业“基座大模型”,如何理解其“基座”的定位?
“‘基座’通常是指建筑的基础底座。”人民法院电子音像出版社社长林志农介绍说,“法信法律基座大模型”中“基座”可以从三个方面来认识理解。
“起基础支撑作用。”林志农说,高质量的法律数据预训练是构建法律大模型能力的关键。“法信法律基座大模型”使用最高法“法信”等多个法律大数据平台的全量数据资源,种类全、规模大、来源可信、权威度高,能够源源不断为大模型预训练和机器深度学习提供充足的法律数据语料,所以它被定义为法律行业应用法律人工智能提供基础数据支撑的“基座”。
“可靠可控。”林志农说,“法信法律基座大模型”主要是应用到各种法律业务场景,所以大模型的安全可靠、自主可控特别重要。“法信法律基座大模型”在语料来源合法性、标注规范性、输出合规性、内容安全性上严格遵照监管要求,所以它是法律行业应用人工智能的安全与合规的“基座”。
“广泛应用。”林志农说,“法信法律基座大模型”通过系统化聚集各类数据并集中化预训练,可以发挥数据资源规模效应、集约效应,降低行业应用大模型的成本。通过开放能力、共享接口、统筹算力,可以促进大模型在法律行业取得更广泛的应用效果。
“所以我们说它是体系化支撑法律行业应用人工智能的‘基座’。”林志农说。
将实现审判活动更高水平智能化
记者了解到,“法信法律基座大模型”已在两个方面加以应用,分别是以“法信法律基座大模型”作为底层支撑的深圳法院人工智能辅助审判系统1.0版上线全面运行后,有力提升了审判工作质效;以“法信法律基座大模型”对最高法“法答网”“人民法院案例库”数据预训练而研发的“库网融合”智能检索系统将于近期试点应用,以数字化、智能化手段促进法律适用的统一。
“研发建设‘法信法律基座大模型’是助推审判工作现代化的有效路径。”余茂玉说,基于海量、权威和高质量法律大数据预训练后形成的“法信法律基座大模型”,具备法律语义理解、逻辑推理、融合搜索、内容生成等基础能力,同司法审判工作深度融合,有利于提升法律文书处理质效,保障法律正确统一实施,助力优化提高裁决公正性和准确性,助力加强监督制约和防范执法司法风险,更好地服务人民群众、服务法治建设、服务高质量发展,能够为审判工作现代化提供有力的科技基础支撑。
“比如现在在‘案多人少’的压力下,即使有案件卷宗电子化的辅助,法官也要耗费大量的时间精力审查阅卷。”人民法院出版社总编辑助理、人民法院电子音像出版社常务副总编辑张承兵说,大模型能够辅助法官从大篇幅的电子卷宗中快速进行信息分析比对,抓取要点、提炼梗概,提高立案审查和阅卷效率。
“再如随着目前法律案例的大量汇聚,法官经常要在上亿的文献中查找法条和类案,甄别筛选都要耗费很大精力。”张承兵说,大模型不但能够提高法官查法找案的质量效率,而且经过训练开发,可以像一个数字工作助手一样,帮助法官对检索到的信息进行整理、分类、提炼,可以基于法官的任务要求去总结分析相关的司法观点、裁判规则,润色校对、审核纠错法律文书。
“未来法院将实现更高水平的数字化、智能化,审判活动将进一步优化,案件处理的质量和效率将得到极大提升。”余茂玉说。
将成为法律从业者的AI智能助手
记者了解到,大模型技术在法律行业广泛推广应用,将大幅提升执法、司法、学法、用法智能化辅助水平和效率。
“在大模型这一底层能力之上,可以对接、支撑各类法律人工智能产品和服务。”张承兵举例介绍了“法信法律基座大模型”如何在行政执法、公共法律服务方面发挥作用。
“比如辅助执法人员对执法案件的信息进行审查核验,监测报警异常情况,匹配推送执法依据和类似案例,检查执法行为是否符合法定程序和规范,确保执法活动的合法性。”张承兵说。
“以往由于法律的高度专业性,公众在进行法律咨询时,通过自然口语所表述的纠纷案情和争议诉求,如果不经过法律工作者的理解转化,很难获得精准、专业的解答。经过专业大数据预训练的法律大模型,不但可以理解公众非专业化的诉求表述,而且本身的回答也能具备相当的专业水平,可以根据具体案情为公众提供和解、调解、应诉等不同策略和建议,可以大大降低公共法律服务的门槛,为公众提供更为便捷、普惠的法律咨询服务。”张承兵说。
余茂玉说,经过对“法信法律基座大模型”底层能力进行更有针对性、场景性的开发应用后,一批数字化、智能化的“办案助理”“普法助手”“领域找法查案专家”“个人法律知识管家”等将上线应用,成为法律从业者的AI智能助手。(张昊)