AI导读:

最高人民法院正式发布国内首个法律行业AI基座大模型,旨在推动法律行业智能化变革,提升审判工作效率,并保障技术和数据内容安全可控。

11月15日,最高人民法院正式揭晓并上线了“法信法律基座大模型”(简称“基座大模型”),标志着国内首个针对法律行业的AI基座大模型面世,这也是国家级法律人工智能的重要基础设施。

该基座大模型集成了众多技术创新,预示着法律行业即将迎来一场智能化变革。对此,研发团队及多位专家学者围绕该模型的技术创新点、应用前景以及研发难点等进行了详细阐述。

在研发过程中,团队面临了模型训练的巨大挑战。人民法院出版社总编辑余茂玉指出,随着大语言模型成为推动AI技术发展的关键力量,法律行业与人工智能的结合将愈发紧密,但同时也带来了安全和风险挑战。为此,人民法院出版社在最高人民法院的指导下,启动了自主可控基座大模型的研发。

在清华大学千亿参数通用大模型的基础上,研发团队投入了3.2亿篇、共计3.67万亿字的法律文献、裁判案例、观点等数据,经过数月的预训练、优化、监督微调和多轮测评,最终成功构建了基座大模型。其中,最大的技术难题在于如何将大模型的通用训练方法与法律行业特性相匹配,包括体现法律数据的专业性、结构性、时效性,利用法律知识体系和图谱增强训练,以及进行法律专业性和内容安全性评测等。

为解决这些问题,研发团队引入了高质量的训练数据和指令集,并进行了体系化模型迭代。同时,还引入了最高人民法院“法信”平台的全流程法律资源标注机制,以及包含18万法律知识体系编码的“法信大纲”,显著提升了模型的知识理解和应用能力。

清华大学计算机科学与技术系副教授刘知远表示,基座大模型的技术创新主要体现在将司法审判业务需求与大模型技术相结合,实现了“先通后专,通专结合”,为法律业务提供了可靠支撑。

在谈及基座大模型的意义时,余茂玉指出,这是落实总体国家安全观的具体行动,是推动法律行业新质生产力发展的创新引擎,也是推动审判工作现代化的有效途径。基座大模型不仅促进了现代科技与司法审判工作的深度融合,还提升了法律行业的人工智能技术应用水平,确保了技术和数据内容的安全可控。

清华大学科研院院长、互联网司法研究院院长刘奕群认为,基座大模型是数字法院建设的关键基础设施,具有重塑审判业务流程的巨大潜力。

展望未来,基座大模型有望大幅提升法律工作者的工作效率,实现工作的规范化和统一法律适用。随着大模型智能体技术的发展,每位法律工作者都将拥有专属的智能体助理,承担重复性劳动和简单的创造性工作。刘知远预测,法律智能体将呈现多角色分工与多智能体协同的趋势,构建一个更高效、更高质量的群体智能工作协同网络。

(文章来源:科技日报)