关键词:
人工智能
法律人工智能
法律大模型
通用大模型
数据
摘要:
法律人工智能算法模型的发展先后经历了总结推理规则的“推理期”、构建专家知识的“知识期”和运用机器学习的“学习期”,现在已经进入法律大模型构建的“大模型期”。法律大模型构建一般以通用大模型为底座,构建模式主要有通用大模型微调模式与专家知识库增强模式,两种构建模式在数据准备、算力资源、训练过程等方面存在显著差异。目前国内外相关研究已纷纷投入法律垂直领域大模型构建的探索实践,但受到数据质量偏低、法律知识不全、算法解释困难、提示工程缺失等问题的限制,法律大模型的研究和应用尚未达到预期效果。在构建法律大模型时,应充分考虑模型开源程度、训练参数量、领域相关性、服务模式、应用场景等因素选择合适的通用大模型作为模型底座,然后按照法律数据、法律知识、指令工程、结果评估等四个关键步骤提升模型效果,在几大核心业务场景的应用实践中,进一步总结和反馈法律大模型存在的问题,并对其进行持续调整和优化。