standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210147755.9 (22)申请日 2022.02.17 (71)申请人 东南大学 地址 210096 江苏省南京市玄武区四牌楼 2 号 (72)发明人 毕胜 程茜雅 漆桂林  (74)专利代理 机构 南京众联专利代理有限公司 32206 专利代理师 杜静静 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 16/31(2019.01) G06F 40/30(2020.01) G06F 40/211(2020.01)G06F 40/268(2020.01) G06F 40/289(2020.01) G06N 5/02(2006.01) G06Q 10/04(2012.01) G06Q 50/18(2012.01) (54)发明名称 基于层级式法律知识与双 图联合表示学习 的罪名预测方法 (57)摘要 本发明涉及一种基于层级式法律知识与双 图联合表 示学习的罪名预测方法, 主要用于依据 案件事实描述对被告自动进行罪名预测, 尤其是 易混淆罪名的预测, 辅助法官判案。 本发明首先 利用爬虫技术从中国裁判文书网上爬取大量法 律文书, 并对裁判文书进行初步处理, 提取出每 份文书的事实描述部分以及对应的判决罪名, 构 建结构图和语义图, 并使用联合图交互得到事实 描述的语义表 示向量。 然后利用爬虫技术爬取所 有罪名的构成要件, 作为专业法律知识用以区分 罪名, 并使用双图联合表示学习得到每个罪名知 识的语义表示向量。 然后利用注意力机制, 得到 知识感知的事实描述语义向量, 最后将其与原事 实向量相结合, 输入到softmax层得到该事实描 述对应的罪名预测结果。 权利要求书3页 说明书10页 附图4页 CN 115048510 A 2022.09.13 CN 115048510 A 1.一种基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 所述 方法包括以下步骤: 步骤1)利用Scrapy爬虫框架从中国裁判文书网站上爬取海量的裁判文书, 再次利用该 爬虫框架从找法 网上爬取所有罪名的构成要件, 包括客观要件、 客体要件、 主观要件和主体 要件; 步骤2)分析裁判文书的内容后发现, 裁判文书具有固定的数据格 式, 一般由原告诉称、 被告辩称、 事实描述、 法院观点、 裁判结果等几部 分组成,基于此, 设计正则表达式对裁判文 书进行初步处 理, 抽取出事实描述部分和判决罪名; 步骤3)对所述步骤2)最终得到的事实描述部分, 将单词视为节点, 利用互信息计算节 点之间的边的权 重, 从而构建结构图, 建模 事实描述的文本结构信息; 步骤4)对所述步骤2)最终得到的事实描述部分, 首先使用一种共指解析模型, 将指代 相同实体的代词替换为其原始实体名称,然后利用依存分析技术抽取出事实描述文本的语 义关系; 步骤5)通过双图联合交互过程, 交换结构图和语义图的特征信息, 并更新各自图中的 节点信息, 最终得到结构图的向量表示和语义图的向量表示, 并拼接获得最终事实描述语 义向量; 步骤6)对步骤1)中爬取得到的所有罪名构成要件, 将其作为专业法律知识用以区分罪 名, 并使用一种面向层级罪名知识的异构图表示学习方法得到每个罪名知识的语义表示向 量; 步骤7)基于事实描述语义向量和罪名知识语义向量, 利用注意力机制, 通过知识匹配 网络得到知识感知的事实描述语义向量; 步骤8)将知识感知的事实向量与原事实向量相结合, 输入到softmax层得到该事实描 述对应的罪名预测结果。 2.根据权利要求1所述的基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 步骤3)对所述步骤2)最终得到的事实描述部分, 通过数据预处理手段(分词、 去停用词等)获得单词集, 然后将单词视为节点, 利用互信息计算节点之间的边的权重, 若 互信息大于零, 则在两个节点之间连接一条边, 反之不连接, 从而构建出结构图, 利用图传 播规则更新节点的语义表示向量, 最终建模出事实描述的文本结构信息 。 3.根据权利要求2所述的基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 步骤3)对 所述步骤2)最 终得到的事实描述部 分, 将单词视为节 点, 利用互信息 计算节点之间的边的权重, 从而构建结构图, 建模事实描述的文本结构信息, 具体过程如 下: 对于事实描述部分, 首先得到事实描述中每个单词的词向量, 然后将其构建成一张图, 默认每个单词是一个节点, 共有N个节点, 每个节点都有自己的特征, 这里的特征就是每个 单词最初的词向量, 设这些节点的特征组成一个N ×D维的矩阵X, 然后各个节 点之间的关系 也会形成一个N ×N维的矩阵A, 称为邻接矩阵,并采用点乘互信息(PMI)来计算图中边的权 重, 从而可以保留全局单词共现信息,将事实描述文本表示成一张图后, 有效的获取文本整 体上复杂的结构关系。 4.根据权利要求1所述的基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 步骤4)中, 具体来说, 将文本中的句子分析成一棵依存句法树, 描述各个短语权 利 要 求 书 1/3 页 2 CN 115048510 A 2之间的依存关系, 即指出词语之 间在句法上的搭配关系比如 主谓宾关系、 介宾关系等, 然最 后将短语作为语义图中的节点, 并根据这些语义依存关系在节点之间连接边, 从而构建出 语义图, 建模 事实描述的语义信息 。 5.根据权利要求1所述的基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 步骤4)中具体过程如下: 首先设计一种共指解析模型, 将指代相同实体的代词 替换为其原始实体名称, 然后对事实描述中的每个句子使用双仿射注 意力模型的AllenNLP 实现来获得它的依存解析树, 通过删除不必要的组件、 合并连续节点形成完整语义单元来 进一步修改该依存解析树, 最后, 由于每个句子都有自己的依存解析树, 需要在不同解析树 的相似节点之间添加树间边以建立连接的完整语义图。 6.根据权利要求1所述的基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 所述步骤5)中, 首先需要更新结构图和语义图中节点的信息,对于结构图来 说, 针对每个节点, 利用拉普拉斯平滑作为传播规则, 通过融合该节点相 邻节点的信息来更 新自身信息, 对于语义图来说, 由于存在多种语义关系, 所以边的类型不尽相同, 故采用多 关系门控图神经网络编码每种边类型 的语义信息,由于针对每个节点, 相邻节点的重要程 度不一样, 所以采用注意力机制动态建模相 邻节点的权重, 从而 更新该节点信息, 对于结构 图和语义图, 在每个更新时间步, 需要分别计算两个门控—更新门和重置门, 来决定有多少 信息应该被传递和舍弃。 7.根据权利要求1所述的基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 所述步骤5)中, 为了推动结构图和语义图之 间的信息共享和交互, 利用结构图 的更新门和重置门来控制语义图的信息传递, 同理, 利用语义图的更新 门和重置门来控制 结构图的信息传递, 经过多轮信息传递后, 将结构图的单词节点信息与语义图中包含该单 词的短语节点信息相联结, 最终得到语义丰富的单词节点信息, 最后将每个单词节点最终 的向量表示 通过最大池化层, 得到最终的事实描述语义表示向量。 8.根据权利要求2所述的基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 所述步骤6)中, 对步骤1)中爬取得到的所有罪名构成要件, 将其作为专业法律 知识用以区分罪名, 在法律知识构建的过程中, 现有的方法一般将知识中的每条信息当作 个体储存处理, 而本发明考虑到了知识之间的类别关系, 譬如 “抢劫罪”、“盗窃罪”和“绑架 罪”分别由四个构成要件组成—客观要件、 客体要件、 主观要件和主体要件, 而它们又同属 于“财产侵占罪 ”这一类别, 因此在构建法律知识时, 不仅抽取了罪名的构成要件, 还抽取了 他们的所属类别, 从而挖掘出罪名之间的层 级关系, 构建了法律知识层级图, 那么在 进行罪 名知识表示时, 就能利用其所属类别 信息, 丰富 罪名的语义表示。 9.根据权利要求2所述的基于层级式法律知识与双图联合表示学习的罪名预测方法, 其特征在于, 所述步骤6)中, 设计了一个面向层级罪名知识的双图联合表示学习方法, 该方 法对词、 句 子标签和实体之间的相互作用进行建模,由单词层级组件图和文本层级罪名知 识图组成, 其中, 单词层 级组件图由包含语义信息的单词图、 包含句法结构信息的词性标签 图和包含额外知识的实体图组成, 用来建模单词层级的语义和句法结构信息, 以弥补上下 文信息的不足, 文本层级罪名知识图以单词层级组件图为基础, 通过对单词层级组件图做 层级池化, 实现动态学习和优化; 在单词层级组件图中, 对于单词图, 首先采用分词工具从罪名要件文本中获得单词, 然权 利 要 求 书 2/3 页 3 CN 115048510 A 3

PDF文档 专利 基于层级式法律知识与双图联合表示学习的罪名预测方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于层级式法律知识与双图联合表示学习的罪名预测方法 第 1 页 专利 基于层级式法律知识与双图联合表示学习的罪名预测方法 第 2 页 专利 基于层级式法律知识与双图联合表示学习的罪名预测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:33上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。