standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210044549.5 (22)申请日 2022.01.14 (71)申请人 上海甚高信息技 术有限公司 地址 201800 上海市嘉定区菊园新区环城 路2222号1幢J1376室 (72)发明人 林志强 童丹  (74)专利代理 机构 成都佳划信知识产权代理有 限公司 5126 6 代理人 任远高 (51)Int.Cl. G06F 21/55(2013.01) G06V 30/40(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 30/42(2022.01)G06V 30/10(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06F 40/30(2020.01) (54)发明名称 基于电子档案的敏感内容处理方法、 装置、 存储介质和计算机设备 (57)摘要 本发明属于档案数字化技术领域, 提供了一 种基于电子档案的敏感内容处理方法、 装置、 存 储介质和计算机设备, 本发明采 取对电子档案文 本内容的敏感信息进行识别, 然后通过对敏感文 字、 语义、 词组的识别处理, 实现敏感信息内容的 整页剔除、 敏感位置抹除或遮盖处理, 由此实现 了对档案电子文件的敏 感内容控制, 有效地解决 了现有技 术所存在的问题。 权利要求书2页 说明书5页 附图2页 CN 114417327 A 2022.04.29 CN 114417327 A 1.一种基于电子档案的敏感内容处 理方法, 其特 征在于, 包括以下步骤: S1.获取电子档案的原 始图像; S2.调用文本检测模型, 将所述原始图像输入至文本检测模型, 获得原始图像的文本信 息; S3.调用敏感信息识别模型, 将所述文本信息输入至敏感信 息识别模型, 获得敏感信息 识别结果; S4.对敏感信息识别结果进行分级处理, 根据不同的敏感信 息设置不同的敏感级, 所述 敏感级由低至高依次包括 I级、 II级、 III级……N级; S5.根据所述的分级处 理结果, 输出 X个与所述原 始图像对应的复制图像, 其中, X= N; S6.根据不同敏感级, 对每 个复制图像的敏感信息进行差异化的敏感信息处 理; S7.输出X个经过敏感信息处 理后的目标图像。 2.根据权利要求1所述的基于电子档案的敏感内容处理方法, 其特征在于: 还包括S8. 将目标图像分发至不同的终端。 3.根据权利要求2所述的基于电子档案的敏感内容处理方法, 其特征在于: 所述步骤S6 中, 差异化的敏感信息处理方法如下: 针对第一个复制图像的敏感信息对I级的敏感信息进 行敏感信息处理, 针对第二个复制图像的敏感信息对I级和II级的敏感信息进行敏感信息 处理, 针对第三个复制图像的敏感信息对I级、 II级和III级的敏感信息进 行敏感信息处理, 以此类推, 针对第X个复制图像的敏感信息, 则对I级、 II级、 III级 ……N级的敏感信息进行 敏感信息处 理。 4.根据权利要求3所述的基于电子档案的敏感内容处理方法, 其特征在于: 所述步骤S6 中敏感信息处 理包括整页图像剔除、 敏感信息位置抹除或遮盖 。 5.根据权利要求4所述的基于电子档案的敏感内容处理方法, 其特征在于, 所述步骤S3 中敏感信息识别模型的构建方法如下: 首先, 构建敏感信息文本库; 其次, 从敏感信息文本 库中随机获取敏感文字、 词组或语句, 生 成样本文本; 最后, 基于样 本文本通过CNN卷积神经 网络模型进行训练, 得到敏感信息识别模型。 6.根据权利要求5所述的基于电子档 案的敏感内容处理方法, 其特征在于: 还包括对敏 感信息文本库进行迭代处 理。 7.一种敏感内容处 理装置, 其特 征在于, 包括: 图像获取模块, 获取电子档案的原 始图像; 文本检测模块, 调用文本检测模型, 将所述原始图像输入至文本检测模型, 获得原始图 像的文本信息; 敏感信息识别模块, 调用敏感信息识别模型, 将所述文本信息输入至敏感信息识别模 型, 获得敏感信息识别结果; 敏感信息分级模块, 对敏感信息识别结果进行分级处理, 根据不同的敏感信息设置不 同的敏感级, 所述敏感级由低至高依次包括 I级、 II级、 III级……N级; 图像复制模块.根据所述的分级处理结果, 输出X个与所述原始图像对应的复制图像, 其中, X= N; 敏感信息处理模块, 根据不同敏感级, 对每个复制图像的敏感信息进行差异化的敏感 信息处理;权 利 要 求 书 1/2 页 2 CN 114417327 A 2图像输出模块, 输出 X个经过敏感信息处 理后的目标图像。 8.一种计算机可读存储介质, 其特征在于: 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序当被处理器执行时, 所述处理器执行如权利要求1~6任一项所述的基 于电子档案的敏感内容处 理方法。 9.一种计算机设备, 其特征在于, 所述计算机设备包括存储器和 处理器; 所述存储器, 用于存储计算机程序, 所述处理器, 用于执行所述计算机程序并在执行所述计算机程序时 实现如权利要求1~6任一项所述的基于电子档案的敏感内容处 理方法。权 利 要 求 书 2/2 页 3 CN 114417327 A 3

PDF文档 专利 基于电子档案的敏感内容处理方法、装置、存储介质和计算机设备

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于电子档案的敏感内容处理方法、装置、存储介质和计算机设备 第 1 页 专利 基于电子档案的敏感内容处理方法、装置、存储介质和计算机设备 第 2 页 专利 基于电子档案的敏感内容处理方法、装置、存储介质和计算机设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。