数据库 频道

阿里达摩院获中国法律智能技术评测两项冠军,参赛模型底座已在魔搭社区开放

  2月3日消息,由最高人民法院司改办和中国中文信息学会指导的中国法律智能技术评测(CAIL 2022)于日前公布比赛结果,阿里巴巴达摩院在八项任务中获得两个冠军,是唯一获得多项第一的参赛团队。据介绍,此次参赛使用的预训练大模型底座通义AliceMind-structBERT已在魔搭社区开放(https://www.modelscope.cn/models/damo/nlp_structbert_backbone_base_law/summary),该模型是法律AI领域首个亿级数据规模的大模型。

  近年来,用AI辅助司法工作者提升案件处理的效率和公正性,逐渐成为法律领域的趋势。作为国内最权威的法律AI竞赛,CAIL已连续举办5届比赛。 据介绍,CAIL 2022设置了司法考试、事件检测、文书校对、类案检索、涉法舆情摘要、论辩理解、信息抽取、可解释类案匹配八项任务,共吸引2053支高校、企业和组织队伍参赛。最终,达摩院在众多参赛队伍中脱颖而出,获得文书校对和可解释类案匹配两项任务的最高分。

文书校对任务成绩榜单

  文书校对主要用于辅助司法人员检出并纠正法律文书中存在的错误,例如错别字、冗余、缺失、乱序等类型错误。此次比赛,达摩院采用了序列到编辑和序列到序列两种主流的模型结构,并且采用编辑级别投票的方式对二者进行集成,其可以尝试将错误的句子翻译成正确的句子,同时对错误位置进行插入、修改、删除等编辑动作。此外,为解决训练数据不足的问题,达摩院还采用数据增强的方法生成了大量的训练语料,有效提升模型的纠错能力,最终该模型以81.759分的成绩获得第一。

可解释类案匹配任务成绩榜单

  可解释类案匹配可以为待决案件的裁判提供参考和依据。参赛队伍需要针对系统给定的两个案件信息,来判断两个案件是“匹配”、“部分匹配”还是“不匹配”关系。达摩院基于法律特征句,构建了句-段-案件的类案匹配体系,最终判断出案件匹配程度,而其中的句子和段落则可成为类案匹配的依据,从而达到模型的可解释性。并且对案件匹配任务进行了细粒度的拆解,针对不同匹配性质选用不同文本输入,有效提升模型匹配的鲁棒性。最终总成绩为0.801,位列第一位。

  目前,达摩院在法律AI领域已发表数十篇国际顶会论文,团队辅助研发的AI法官助理“小智”已在浙江省高院、黑龙江高院等法院上线应用,可将简单案件庭审效率提升50%以上,已辅助审理案件超10000件。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
0
相关文章