standard library
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210102742.X (22)申请日 2022.01.27 (65)同一申请的已公布的文献号 申请公布号 CN 114492409 A (43)申请公布日 2022.05.13 (73)专利权人 百度在线网络技 术 (北京) 有限公 司 地址 100085 北京市海淀区上地十街10号 百度大厦三层 (72)发明人 侯柳平 王磊  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 霍莉莉 臧建明 (51)Int.Cl. G06F 40/279(2020.01) G06F 40/30(2020.01) G06F 16/28(2019.01) (56)对比文件 CN 113806794 A,2021.12.17 CN 112347226 A,2021.02.09 CN 10982 9269 A,2019.0 5.31CN 112579729 A,2021.0 3.30 CN 113792341 A,2021.12.14 CN 113822036 A,2021.12.21 CN 113569577 A,2021.10.2 9 CN 108694 462 A,2018.10.23 CN 111967245 A,2020.1 1.20 CN 112749274 A,2021.0 5.04 CN 112257114 A,2021.01.2 2 CN 109214165 A,2019.01.15 CN 111723191 A,2020.09.2 9 CN 113360603 A,2021.09.07 未知.Why leg al profes sionals need a specialist tool to compare documents. 《www.docscorp.com/news/document-software- blogs/document- compariso n-tool/》 .2020, 周红 等.“基于NLP技术的建设工程合同风 险智能检测框架研究 ”. 《建筑经济》 .2021, 李玲 等.基 于自然语言处 理的合同智能审 查应用设计. 《中国信息化》 .2020, (续) 审查员 王咏冬 (54)发明名称 文件内容的评价方法、 装置、 电子设备及程 序产品 (57)摘要 本公开提供的文件内容的评价方法、 装置、 电子设备及程序产品, 涉及自然语言处理技术, 包括: 接收用于对待处理文件进行评价的请求, 并根据请求获取待处理文件, 以及用于评价待处 理文件的预设的第一文件; 根据第一文件, 确定 待处理文件的完整性分值, 以及 待处理文件的合 法性分值; 根据待处理文件的完整性分值和合法 性分值, 确定待处理文件的评价结果, 评价结果 用于表征待处理文件是否合规。 本公开提供的文 件内容的评价方法、 装置、 电子设备及程序产品 中, 可以从完整性和合法性两个方面, 利用预设的第一文件评价待处理文件, 从而得到待处理文 件准确的评价结果。 同时, 这种自动化评价待处 理文件的方式, 还能够提高文 件的评价效率。 [转续页] 权利要求书4页 说明书12页 附图3页 CN 114492409 B 2022.12.20 CN 114492409 B (56)对比文件 PaperWeekly.如何保护个人信息安全? 天津 大学提出隐私政策合 规性检测工具. 《ht tps:// blog.csdn.net/ c9Yv2cf9I0 6K2A9E/article/details/114695694》 .2021,1- 5. 赵杨 等.“基于机器学习的医疗健康AP P隐 私政策合 规性研究”. 《数据分析与知识发现》 .2021,2/2 页 2[接上页] CN 114492409 B1.一种文件内容的评价方法, 包括: 接收用于对待处理文件进行评价的请求, 并根据所述请求获取待处理文件, 以及用于 评价所述待处 理文件的预设的第一文件; 根据所述第一文件, 确定所述待处理文件的完整性分值, 以及所述待处理文件的合法 性分值; 根据所述待处理文件的完整性分值和所述合法性分值, 确定所述待处理文件的评价结 果, 所述评价结果用于表征 所述待处 理文件是否合 规; 所述根据所述第一文件, 确定所述待处 理文件的完整性分值, 包括: 根据所述第 一文件中包括的章节信 息, 确定所述待处理文件中各语句所涉及的关联章 节; 比对所述待处 理文件中涉及的全部关联章节, 与所述第一文件中包括的章节信息; 若所述全部关联章节中缺失任一所述章节信 息, 则在预设的完整性总分值基础上扣除 与缺失的章节信息对应的分值, 得到所述待处 理文件的完整性分值; 所述根据所述第一文件, 确定所述待处 理文件的合法性分值, 包括: 基于预设的信 息抽取方法在所述第 一文件的条文中, 抽取第 一要素信 息; 其中, 一条第 一要素信息与所述第一文件中的一个条文对应; 基于所述预设的信 息抽取方法在所述待处理文件的语句中, 抽取与 各所述语句对应的 各第二要素信息; 根据所述第一要素信息、 所述第二要素信息, 确定所述待处 理文件的合法性分值。 2.根据权利要求1所述的方法, 其中, 所述根据所述第一文件中包括的章节信息, 确定 所述待处 理文件中各语句所 涉及的关联章节之前, 所述方法还 包括: 获取所述第一文件中包括的章节信息 。 3.根据权利要求2所述的方法, 其中, 基于预设的信 息抽取方法在待处理 的文本内容中 抽取要素信息, 包括: 对待处理的文本内容中识别实体, 并确定实体之间的关系; 所述待处理的文本内容包 括所述第一文件中的条文、 所述待处 理文件中的语句; 根据所述实体之间的关系, 在所述实体中确定出所述要素信 息; 其中, 所述要素信 息包 括行为主体、 涉及的个人信息, 以及以下任一种信息: 权利、 义务、 法律责任。 4.根据权利要求3所述的方法, 其中, 所述根据所述实体之间的关系, 在所述实体中确 定出所述要素信息, 包括: 根据所述实体之间的关系确定所述待处 理的文本内容中的谓语; 根据所述谓语在所述实体中确定出主语实体, 并将所述主语实体确定为所述行为主 体。 5.根据权利要求3所述的方法, 其中, 所述根据所述实体之间的关系, 在所述实体中确 定出所述要素信息, 包括: 根据所述实体之间的关系确定所述待处 理的文本内容中的谓语; 根据所述谓语在所述实体中确定出谓语作用的对象实体, 并将所述谓语作用的对象实 体确定为以下任一种信息:权 利 要 求 书 1/4 页 2 CN 114492409 B 3

PDF文档 专利 文件内容的评价方法、装置、电子设备及程序产品

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文件内容的评价方法、装置、电子设备及程序产品 第 1 页 专利 文件内容的评价方法、装置、电子设备及程序产品 第 2 页 专利 文件内容的评价方法、装置、电子设备及程序产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:41上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。