standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210898184.2 (22)申请日 2022.07.28 (71)申请人 深圳市星桐科技有限公司 地址 518027 广东省深圳市福田区华强北 街道福强社区红荔路2001号四川大厦 A座1413 (72)发明人 秦勇 (74)专利代理 机构 北京北汇律师事务所 1 1711 专利代理师 吕良 (51)Int.Cl. G06V 30/22(2022.01) G06V 20/62(2022.01) G06V 30/19(2022.01) G06V 10/772(2022.01) G06V 10/74(2022.01) (54)发明名称 文本识别方法、 装置、 电子设备及存 储介质 (57)摘要 本公开提供一种文本识别方法、 装置、 电子 设备及存储介质, 属于图像处理领域。 该方法包 括: 获取待识别文本图像; 基于文本识别模型的 第一文本识别单元, 对所述待识别文本图像进行 处理, 以确定所述待识别文本图像中至少一个书 写文本的正确概率; 在基于所述正确概率确定所 述待识别文本图像中存在目标错误文本时, 基于 所述文本识别模 型的第二文本识别单元, 确定该 目标错误文本的错误类别; 基于所述目标错误文 本及其错误类别, 确定所述待识别文本图像的文 本识别结果。 采用本公开, 可以识别错误文本的 错误类别。 权利要求书2页 说明书12页 附图4页 CN 115273103 A 2022.11.01 CN 115273103 A 1.一种文本识别方法, 其特 征在于, 所述方法包括: 获取待识别文本图像; 基于文本识别模型的第一文本识别单元, 对所述待识别文本 图像进行处理, 以确定所 述待识别文本图像中至少一个书 写文本的正确概 率; 在基于所述正确概率确定所述待识别文本图像中存在目标错误文本时, 基于所述文本 识别模型的第二文本识别单 元, 确定该目标错 误文本的错 误类别; 基于所述目标错 误文本及其 错误类别, 确定所述待识别文本图像的文本识别结果。 2.根据权利要求1所述的方法, 其特征在于, 所述在基于所述正确概率确定所述待识别 文本图像中存在目标错误文本时, 基于所述文本识别模型 的第二文本识别单元, 确定该目 标错误文本的错 误类别, 包括: 基于所述第 二文本识别单元对所述待识别文本图像进行处理, 确定每个书写文本对应 的书写文本图像的字形 特征向量; 获取所述目标错 误文本对应的至少一个预设错 误字形图像的第一字形 特征向量; 确定所述目标错误文本对应的书写文本图像的字形特征向量与所述第一字形特征向 量的第一相似度; 基于所述第一相似度, 确定所述目标错误文本的错误类别, 其中, 所述目标错误文本 为, 所述至少一个书 写文本中, 正确概 率小于预设概 率阈值的书 写文本。 3.根据权利要求2所述的方法, 其特 征在于, 所述方法还 包括: 确定每个书写文本对应的书写文本图像的字形特征向量分别与多个预设正确字形图 像的第二字形 特征向量的第二相似度; 基于所述第二相似度, 确定每 个书写文本对应的第一 正确文本 。 4.根据权利要求3所述的方法, 其特征在于, 所述第 一正确文本对应有至少一个预设错 误字形图像; 所述获取所述目标错误文本对应的至少一个预设错误字形图像的第 一字形特征向量, 包括: 在确定所述目标错误文本对应的第 一正确文本之后, 确定所述第 一正确文本对应的至 少一个预设错 误字形图像; 将所述第一正确文本对应的至少一个预设错误字形图像的字形特征向量确定为所述 目标错误文本对应的至少一个预设错 误字形图像的第一字形 特征向量。 5.根据权利要求1 ‑4中任一项所述的方法, 其特征在于, 所述基于文本识别模型的第一 文本识别单元, 对所述待识别文本图像进行处理, 以确定所述待识别文本图像中至少一个 书写文本的正确概 率, 包括: 针对所述至少一个书写文本中的任一书写文本, 基于文本识别模型的第 一文本识别单 元, 确定该书写文本属于预先设置的字符字典中的每个字符的概率, 并基于所述概率确定 该书写文本的正确概 率。 6.根据权利要求1 ‑4中任一项所述的方法, 其特 征在于, 所述方法还 包括: 针对所述至少一个书写文本中的任一书写文本, 基于文本识别模型的第 一文本识别单 元, 确定该书 写文本属于预 先设置的字符字典中的每 个字符的概 率; 基于该书写文本属于预先设置的字符字典中的每个字符的概率, 确定该书写文本对应权 利 要 求 书 1/2 页 2 CN 115273103 A 2的第二正确文本 。 7.根据权利要求6所述的方法, 其特征在于, 所述基于所述目标错误文本及其错误类 别, 确定所述待识别文本图像的文本识别结果, 包括: 基于每个书写文本对应的目标正确文本, 确定所述待识别文本图像的正确文本识别结 果, 其中, 所述目标正确文本为该书写文本对应的第一正确文本和第二正确文本中置信度 高的正确文本; 基于所述目标错误文本对应的错误字形图像及其错误类别, 确定所述待识别文本图像 的错误文本识别结果; 将所述正确文本识别结果和所述错误文本识别结果, 作为所述待识别文本图像的识别 结果。 8.根据权利要求1 ‑4中任一项所述的方法, 其特征在于, 每个书写文本对应有预设错误 字形字典, 该 预设错误字形字典中包括有 多个预设错 误字形图像, 其中, 所述方法还 包括: 在所述目标错误文本对应的错误字形图像不属于所述预设错误字形库中任一预设错 误字形图像时, 将该目标错 误文本对应的错 误字形图像保存至该 预设错误字形字典中。 9.一种文本识别装置, 其特 征在于, 所述装置包括: 获取模块, 用于获取待识别文本图像; 处理模块, 用于基于文本识别模型的第一文本识别单元, 对所述待识别文本 图像进行 处理, 以确定所述待识别文本图像中至少一个书写文本的正确 概率; 在基于所述正确 概率 确定所述待识别文本图像中存在目标错误文本时, 基于所述文本识别模型的第二文本识别 单元, 确定该目标错 误文本的错 误类别; 确定模块, 用于基于所述目标错误文本及其错误类别, 确定所述待识别文本 图像的文 本识别结果。 10.一种电子设备, 包括: 处理器; 以及 存储程序的存 储器, 其中, 所述程序包括指令, 所述指令在由所述处理器执行时使所述处理器执行根据权 利要求1‑8中任一项所述的方法。 11.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使计算机执 行根据权利要求1 ‑8中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115273103 A 3
专利 文本识别方法、装置、电子设备及存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:31:53
上传分享
举报
下载
原文档
(699.4 KB)
分享
友情链接
GB-T 15609-2008 彩色显示器色度测量方法.pdf
GB-T 38638-2020 信息安全技术 可信计算 可信计算体系结构.pdf
GB-T 4937.42-2023 半导体器件 机械和气候试验方法 第42部分:温湿度贮存.pdf
GB-T 41389-2022 信息安全技术 SM9密码算法使用规范.pdf
GB-T 7931-2008 1500 11 000 12 000 地形图航空摄影测量外业规范.pdf
GB-T 33630-2017 海上风力发电机组 防腐规范.pdf
GB-T 16945-2009 电子工业用气体 氩.pdf
JR-T 0071.5—2020 金融行业网络安全等级保护实施指引 第5部分:审计要求.pdf
GB-T 29171-2012 岩石毛管压力曲线的测定.pdf
GB-T 32427-2015信息技术SOA成熟度模型及评估方法.pdf
山东省规章和行政规范性文件备案规定.pdf
DB15-T 2740—2022 高繁母羊妊娠毒血症防控技术规范 内蒙古自治区.pdf
GB-T 41547-2022 地采暖用木质地板.pdf
T-ZZB 2928—2022 锥形磨浆机.pdf
GB-T 42573-2023 信息安全技术 网络身份服务安全技术要求.pdf
SL-T 450—2021 堰塞湖风险等级划分与应急处置技术规范.pdf
GB-T 34766-2017 矿物源总腐殖酸含量的测定.pdf
GB-T 1683-2018 硫化橡胶 恒定形变压缩永久变形的测定方法.pdf
绿盟 软件供应链安全技术白皮书.pdf
CISP-PTE 知识体系大纲.pdf
1
/
19
评价文档
赞助2.5元 点击下载(699.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。