standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210011124.4 (22)申请日 2022.01.05 (71)申请人 重庆大学 地址 400030 重庆市沙坪坝区沙正 街174号 (72)发明人 林英撑 梅秀九 刘炳胜 何伟 张玲 梅紫华 韩劲锋 宋万年 (74)专利代理 机构 重庆华科专利事务所 5 0123 代理人 谭小琴 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/25(2019.01) G06F 40/253(2020.01) G06F 40/295(2020.01) G06F 40/30(2020.01) (54)发明名称 基于知识图谱的法律文书结构化入库方法 及系统 (57)摘要 本发明公开的一种基于知识图谱的法律文 书结构化入库方法及系统, 包括以下步骤: 步骤 1.获取相关法律文书; 步骤2.对法律文书进行预 处理; 步骤3.根据候选语句对法律文书进行语句 分类并标注; 步骤4.对分类标注完成后的语句做 语义分析, 并对分析后的结果通过三元组抽取模 型生成法律要素三元组, 将法律要素三元组构建 成法律文书知识图谱; 步骤5.将已构建的法律文 书知识图谱入库存储。 本发明能够将法律文书非 结构化的文本信息结构化, 提高了获取法律文书 中信息的效率。 权利要求书2页 说明书6页 附图3页 CN 114372153 A 2022.04.19 CN 114372153 A 1.一种基于知识图谱的法律文 书结构化入库方法, 其特 征在于, 包括: 步骤1.获取相关法律文 书; 步骤2.对法律文 书进行预处理; 步骤3.根据候选语句对法律文 书进行语句分类并标注; 步骤4.对分类标注完成后的语句做语义分析, 并对分析后的结果通过三元组抽取模型 生成法律要素三元组, 将法律要素三元组构建成法律文 书知识图谱; 步骤5.将已构建的法律文 书知识图谱 入库存储。 2.根据权利要求1所述的基于知识图谱的法律文书结构化入库 方法, 其特征在于, 所述 步骤2具体为: 对法律文书文本进行分句, 其中, 分句是按照中文标点符号里的句号、 问号、 感叹号为 标志将段落文本分为语句, 将文 书的内容按照文本的顺序分成若干语句; 去除分句完成后的法律文书中的辅助句子, 辅助句子具有如下特征: 形式上是句子的 句首与句尾有括 号, 内容上 是附录的内容。 3.根据权利要求2所述的基于知识图谱的法律文书结构化入库 方法, 其特征在于, 所述 步骤3具体为: 步骤31, 设置特征字符语句标注模板集, 该特征字符语句标注模板集包括有至少一个 特征字符, 其中, 所述特征字符为法律文件的句首部分文字; 对预处理后的法律文书, 通过 与特征字符语句标注模板集中的各特征字符进行文本匹配, 若匹配成功, 则对含有特征字 符的句子进行 标注; 步骤32, 设置正则表达式语句标注模板集, 该正则表达式语句标注模板集包括有至少 一个正则表达式, 其中, 所述正则表达式由数字和特征字符构成; 将未被步骤31标注的部 分, 与正则表达式语句标注模板集中的各正则表达式进 行匹配, 若匹配成功, 则对法律文中 匹配到的语句进行 标注; 步骤33, 利用PKU98语料库来训练词性分析标注模型, 得到词性分析标注模型的参数; 通过训练好的词性分析标注模型对未被步骤31和步骤32标注的部分进行词性和命名实体 的联合标注。 4.根据权利要求1至3任一所述的基于知识图谱的法律文书结构化入库方法, 其特征在 于, 所述步骤4包括: 步骤41.获取 标注完成的文本; 步骤42.深度学习训练与语义分析; 步骤43.由三元组抽取模型生成法律要素三元组; 步骤44.构建知识图谱。 5.根据权利要求4所述的基于知识图谱的法律文书结构化入库 方法, 其特征在于, 所述 步骤42具体包括: 采用ChineseStanfordDependencies依存关系标注集制 作的语料库训练Bert深度学习 模型来分析语句中的词与词的语法关系, 语句中的语法关系由 ChineseStanfordDependencies依存关系标注集构成。 6.根据权利要求5所述的基于知识图谱的法律文书结构化入库 方法, 其特征在于, 所述 步骤43具体包括:权 利 要 求 书 1/2 页 2 CN 114372153 A 2建立三元组抽取模型; 按照三元组抽取模型抽取深度学习训练与语义分析的语义关系获得法律文书的三元 组信息, 即获得法律文书要素之间的关系; 其中, 三元 组由 (实体1, 关系, 实体2) 和 (实体, 属 性, 属性值) 构成。 7.根据权利要求6所述的基于知识图谱的法律文书结构化入库 方法, 其特征在于, 所述 步骤44具体包括: 将每个语句中的三元组以对应的语句主题词为中心构建语句级知识图谱, 知识图谱的 节包含三元组实体和 属性值, 知识图谱的边由三元组关系和 属性构成; 将语句级知识图谱构建成篇章级知识图谱, 篇章级知识图谱的框架由语句级知识图谱 的语句标签构成。 8.根据权利要求5至7任一所述的基于知识图谱的法律文书结构化入库方法, 其特征在 于, 所述步骤5中, 将法律文书知识图谱以一个N叉树的存储 结构进行存储, 并将存储节 点与 存储节点之间的节点关系设置为 查询时的链接 。 9.一种基于知识图谱的法律文书结构化入库系统, 其特征在于, 包括存储器和控制器, 所述存储器内存储有计算机可读程序, 所述计算机可读程序被控制器调用时能执行如权利 要求1至8任一所述的基于知识图谱的法律文 书结构化入库方法的步骤。权 利 要 求 书 2/2 页 3 CN 114372153 A 3
专利 基于知识图谱的法律文书结构化入库方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:34:01
上传分享
举报
下载
原文档
(662.9 KB)
分享
友情链接
绿盟 SecXOps安全智能分析技术白皮书.pdf
GB-T 9359-2016 水文仪器基本环境试验条件及方法.pdf
GB-T 33780.3-2017 基于云计算的电子政务公共平台技术规范 第3部分:系统和数据接口.pdf
算力网络安全白皮书 .pdf
GW0204-2014 国家电子政务外网 安全管理系统技术要求与接口规范.pdf
T-CESA 1120—2020 人工智能芯片 面向边缘侧的深度学习芯片测试指标与测试方法.pdf
DB31-T 945.4-2020 节能服务业服务规范 第4部分:公共建筑能源审计 上海市.pdf
DB5111-T 25-2022 嘉州菜 乐山甜皮鸭制作工艺规范 乐山市.pdf
YDT 4403-2023 开源项目选型参考框架.pdf
医疗卫生机构网络安全管理办法.pdf
T-ZZB 2304—2021 辐射致 制 冷膜.pdf
GM-T 0042-2015 三元对等密码安全协议测试规范.pdf
国家网信办 儿童个人信息网络保护规定 2019.pdf
GB/T 40009-2021 废轮胎、废橡胶热裂解技术规范.pdf
T-CACM 001—2018 古本易筋经十二势导引法技术规范.pdf
GB-T 39637-2020 金属和合金的腐蚀 土壤环境腐蚀性分类.pdf
DL5210.1-2021 电力工程施工质量验收及评价规程 第1部分:土建工程.pdf
GB-T 13747.26-2022 锆及锆合金化学分析方法 第26部分:合金及杂质元素的测定 电感耦合等离子体原子发射光谱法.pdf
GB-T 34680.4-2018 智慧城市评价模型及基础评价指标体系 第4部分:建设管理.pdf
GB-T 30819-2014 机器人用谐波齿轮减速器.pdf
1
/
12
评价文档
赞助2.5元 点击下载(662.9 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。