(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210102742.X
(22)申请日 2022.01.27
(65)同一申请的已公布的文献号
申请公布号 CN 114492409 A
(43)申请公布日 2022.05.13
(73)专利权人 百度在线网络技 术 (北京) 有限公
司
地址 100085 北京市海淀区上地十街10号
百度大厦三层
(72)发明人 侯柳平 王磊
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
专利代理师 霍莉莉 臧建明
(51)Int.Cl.
G06F 40/279(2020.01)
G06F 40/30(2020.01)
G06F 16/28(2019.01)
(56)对比文件
CN 113806794 A,2021.12.17
CN 112347226 A,2021.02.09
CN 10982 9269 A,2019.0 5.31CN 112579729 A,2021.0 3.30
CN 113792341 A,2021.12.14
CN 113822036 A,2021.12.21
CN 113569577 A,2021.10.2 9
CN 108694 462 A,2018.10.23
CN 111967245 A,2020.1 1.20
CN 112749274 A,2021.0 5.04
CN 112257114 A,2021.01.2 2
CN 109214165 A,2019.01.15
CN 111723191 A,2020.09.2 9
CN 113360603 A,2021.09.07
未知.Why leg al profes sionals need a
specialist tool to compare documents.
《www.docscorp.com/news/document-software-
blogs/document- compariso n-tool/》 .2020,
周红 等.“基于NLP技术的建设工程合同风
险智能检测框架研究 ”. 《建筑经济》 .2021,
李玲 等.基 于自然语言处 理的合同智能审
查应用设计. 《中国信息化》 .2020, (续)
审查员 王咏冬
(54)发明名称
文件内容的评价方法、 装置、 电子设备及程
序产品
(57)摘要
本公开提供的文件内容的评价方法、 装置、
电子设备及程序产品, 涉及自然语言处理技术,
包括: 接收用于对待处理文件进行评价的请求,
并根据请求获取待处理文件, 以及用于评价待处
理文件的预设的第一文件; 根据第一文件, 确定
待处理文件的完整性分值, 以及 待处理文件的合
法性分值; 根据待处理文件的完整性分值和合法
性分值, 确定待处理文件的评价结果, 评价结果
用于表征待处理文件是否合规。 本公开提供的文
件内容的评价方法、 装置、 电子设备及程序产品
中, 可以从完整性和合法性两个方面, 利用预设的第一文件评价待处理文件, 从而得到待处理文
件准确的评价结果。 同时, 这种自动化评价待处
理文件的方式, 还能够提高文 件的评价效率。
[转续页]
权利要求书4页 说明书12页 附图3页
CN 114492409 B
2022.12.20
CN 114492409 B
(56)对比文件
PaperWeekly.如何保护个人信息安全? 天津
大学提出隐私政策合 规性检测工具. 《ht tps://
blog.csdn.net/ c9Yv2cf9I0 6K2A9E/article/details/114695694》 .2021,1- 5.
赵杨 等.“基于机器学习的医疗健康AP P隐
私政策合 规性研究”. 《数据分析与知识发现》
.2021,2/2 页
2[接上页]
CN 114492409 B1.一种文件内容的评价方法, 包括:
接收用于对待处理文件进行评价的请求, 并根据所述请求获取待处理文件, 以及用于
评价所述待处 理文件的预设的第一文件;
根据所述第一文件, 确定所述待处理文件的完整性分值, 以及所述待处理文件的合法
性分值;
根据所述待处理文件的完整性分值和所述合法性分值, 确定所述待处理文件的评价结
果, 所述评价结果用于表征 所述待处 理文件是否合 规;
所述根据所述第一文件, 确定所述待处 理文件的完整性分值, 包括:
根据所述第 一文件中包括的章节信 息, 确定所述待处理文件中各语句所涉及的关联章
节;
比对所述待处 理文件中涉及的全部关联章节, 与所述第一文件中包括的章节信息;
若所述全部关联章节中缺失任一所述章节信 息, 则在预设的完整性总分值基础上扣除
与缺失的章节信息对应的分值, 得到所述待处 理文件的完整性分值;
所述根据所述第一文件, 确定所述待处 理文件的合法性分值, 包括:
基于预设的信 息抽取方法在所述第 一文件的条文中, 抽取第 一要素信 息; 其中, 一条第
一要素信息与所述第一文件中的一个条文对应;
基于所述预设的信 息抽取方法在所述待处理文件的语句中, 抽取与 各所述语句对应的
各第二要素信息;
根据所述第一要素信息、 所述第二要素信息, 确定所述待处 理文件的合法性分值。
2.根据权利要求1所述的方法, 其中, 所述根据所述第一文件中包括的章节信息, 确定
所述待处 理文件中各语句所 涉及的关联章节之前, 所述方法还 包括:
获取所述第一文件中包括的章节信息 。
3.根据权利要求2所述的方法, 其中, 基于预设的信 息抽取方法在待处理 的文本内容中
抽取要素信息, 包括:
对待处理的文本内容中识别实体, 并确定实体之间的关系; 所述待处理的文本内容包
括所述第一文件中的条文、 所述待处 理文件中的语句;
根据所述实体之间的关系, 在所述实体中确定出所述要素信 息; 其中, 所述要素信 息包
括行为主体、 涉及的个人信息, 以及以下任一种信息:
权利、 义务、 法律责任。
4.根据权利要求3所述的方法, 其中, 所述根据所述实体之间的关系, 在所述实体中确
定出所述要素信息, 包括:
根据所述实体之间的关系确定所述待处 理的文本内容中的谓语;
根据所述谓语在所述实体中确定出主语实体, 并将所述主语实体确定为所述行为主
体。
5.根据权利要求3所述的方法, 其中, 所述根据所述实体之间的关系, 在所述实体中确
定出所述要素信息, 包括:
根据所述实体之间的关系确定所述待处 理的文本内容中的谓语;
根据所述谓语在所述实体中确定出谓语作用的对象实体, 并将所述谓语作用的对象实
体确定为以下任一种信息:权 利 要 求 书 1/4 页
2
CN 114492409 B
3
专利 文件内容的评价方法、装置、电子设备及程序产品
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:41上传分享