standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210898184.2 (22)申请日 2022.07.28 (71)申请人 深圳市星桐科技有限公司 地址 518027 广东省深圳市福田区华强北 街道福强社区红荔路2001号四川大厦 A座1413 (72)发明人 秦勇  (74)专利代理 机构 北京北汇律师事务所 1 1711 专利代理师 吕良 (51)Int.Cl. G06V 30/22(2022.01) G06V 20/62(2022.01) G06V 30/19(2022.01) G06V 10/772(2022.01) G06V 10/74(2022.01) (54)发明名称 文本识别方法、 装置、 电子设备及存 储介质 (57)摘要 本公开提供一种文本识别方法、 装置、 电子 设备及存储介质, 属于图像处理领域。 该方法包 括: 获取待识别文本图像; 基于文本识别模型的 第一文本识别单元, 对所述待识别文本图像进行 处理, 以确定所述待识别文本图像中至少一个书 写文本的正确概率; 在基于所述正确概率确定所 述待识别文本图像中存在目标错误文本时, 基于 所述文本识别模 型的第二文本识别单元, 确定该 目标错误文本的错误类别; 基于所述目标错误文 本及其错误类别, 确定所述待识别文本图像的文 本识别结果。 采用本公开, 可以识别错误文本的 错误类别。 权利要求书2页 说明书12页 附图4页 CN 115273103 A 2022.11.01 CN 115273103 A 1.一种文本识别方法, 其特 征在于, 所述方法包括: 获取待识别文本图像; 基于文本识别模型的第一文本识别单元, 对所述待识别文本 图像进行处理, 以确定所 述待识别文本图像中至少一个书 写文本的正确概 率; 在基于所述正确概率确定所述待识别文本图像中存在目标错误文本时, 基于所述文本 识别模型的第二文本识别单 元, 确定该目标错 误文本的错 误类别; 基于所述目标错 误文本及其 错误类别, 确定所述待识别文本图像的文本识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述在基于所述正确概率确定所述待识别 文本图像中存在目标错误文本时, 基于所述文本识别模型 的第二文本识别单元, 确定该目 标错误文本的错 误类别, 包括: 基于所述第 二文本识别单元对所述待识别文本图像进行处理, 确定每个书写文本对应 的书写文本图像的字形 特征向量; 获取所述目标错 误文本对应的至少一个预设错 误字形图像的第一字形 特征向量; 确定所述目标错误文本对应的书写文本图像的字形特征向量与所述第一字形特征向 量的第一相似度; 基于所述第一相似度, 确定所述目标错误文本的错误类别, 其中, 所述目标错误文本 为, 所述至少一个书 写文本中, 正确概 率小于预设概 率阈值的书 写文本。 3.根据权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 确定每个书写文本对应的书写文本图像的字形特征向量分别与多个预设正确字形图 像的第二字形 特征向量的第二相似度; 基于所述第二相似度, 确定每 个书写文本对应的第一 正确文本 。 4.根据权利要求3所述的方法, 其特征在于, 所述第 一正确文本对应有至少一个预设错 误字形图像; 所述获取所述目标错误文本对应的至少一个预设错误字形图像的第 一字形特征向量, 包括: 在确定所述目标错误文本对应的第 一正确文本之后, 确定所述第 一正确文本对应的至 少一个预设错 误字形图像; 将所述第一正确文本对应的至少一个预设错误字形图像的字形特征向量确定为所述 目标错误文本对应的至少一个预设错 误字形图像的第一字形 特征向量。 5.根据权利要求1 ‑4中任一项所述的方法, 其特征在于, 所述基于文本识别模型的第一 文本识别单元, 对所述待识别文本图像进行处理, 以确定所述待识别文本图像中至少一个 书写文本的正确概 率, 包括: 针对所述至少一个书写文本中的任一书写文本, 基于文本识别模型的第 一文本识别单 元, 确定该书写文本属于预先设置的字符字典中的每个字符的概率, 并基于所述概率确定 该书写文本的正确概 率。 6.根据权利要求1 ‑4中任一项所述的方法, 其特 征在于, 所述方法还 包括: 针对所述至少一个书写文本中的任一书写文本, 基于文本识别模型的第 一文本识别单 元, 确定该书 写文本属于预 先设置的字符字典中的每 个字符的概 率; 基于该书写文本属于预先设置的字符字典中的每个字符的概率, 确定该书写文本对应权 利 要 求 书 1/2 页 2 CN 115273103 A 2的第二正确文本 。 7.根据权利要求6所述的方法, 其特征在于, 所述基于所述目标错误文本及其错误类 别, 确定所述待识别文本图像的文本识别结果, 包括: 基于每个书写文本对应的目标正确文本, 确定所述待识别文本图像的正确文本识别结 果, 其中, 所述目标正确文本为该书写文本对应的第一正确文本和第二正确文本中置信度 高的正确文本; 基于所述目标错误文本对应的错误字形图像及其错误类别, 确定所述待识别文本图像 的错误文本识别结果; 将所述正确文本识别结果和所述错误文本识别结果, 作为所述待识别文本图像的识别 结果。 8.根据权利要求1 ‑4中任一项所述的方法, 其特征在于, 每个书写文本对应有预设错误 字形字典, 该 预设错误字形字典中包括有 多个预设错 误字形图像, 其中, 所述方法还 包括: 在所述目标错误文本对应的错误字形图像不属于所述预设错误字形库中任一预设错 误字形图像时, 将该目标错 误文本对应的错 误字形图像保存至该 预设错误字形字典中。 9.一种文本识别装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取待识别文本图像; 处理模块, 用于基于文本识别模型的第一文本识别单元, 对所述待识别文本 图像进行 处理, 以确定所述待识别文本图像中至少一个书写文本的正确 概率; 在基于所述正确 概率 确定所述待识别文本图像中存在目标错误文本时, 基于所述文本识别模型的第二文本识别 单元, 确定该目标错 误文本的错 误类别; 确定模块, 用于基于所述目标错误文本及其错误类别, 确定所述待识别文本 图像的文 本识别结果。 10.一种电子设备, 包括: 处理器; 以及 存储程序的存 储器, 其中, 所述程序包括指令, 所述指令在由所述处理器执行时使所述处理器执行根据权 利要求1‑8中任一项所述的方法。 11.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使计算机执 行根据权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115273103 A 3

PDF文档 专利 文本识别方法、装置、电子设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本识别方法、装置、电子设备及存储介质 第 1 页 专利 文本识别方法、装置、电子设备及存储介质 第 2 页 专利 文本识别方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:31:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。