(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211341298.3 (22)申请日 2022.10.31 (71)申请人 山东济矿鲁能煤电股份有限公司阳 城煤矿 地址 272500 山东省济宁市汶上县郭楼镇 张坝口村东 (72)发明人 张书磊 连涛 李强 田兆龙  刘继鹏 董桂锋 路飞 韩青  王帅 刘方  (74)专利代理 机构 济宁仁礼信知识产权代理事 务所(普通 合伙) 37383 专利代理师 李琼 (51)Int.Cl. G06V 30/148(2022.01) G06V 10/26(2022.01)G06T 7/187(2017.01) G06T 7/00(2017.01) (54)发明名称 一种基于图像处 理的煤矿工单识别方法 (57)摘要 本发明涉及图像处理领域, 具体涉及一种基 于图像处理的煤矿工单识别方法。 获取煤矿工单 图像, 获取单元格手写字符区域中的多个连通 域; 根据两两连通域的像素点横坐标范围交集将 对应连通域合并, 获取第一连通域; 对第一连通 域进行垂直投影并对垂直投影进行曲线拟合; 根 据拟合曲线对第一连通域进行分割, 得到第二连 通域; 将每个单元格手写字 符区域中第二连通域 的高度均值作为宽度阈值; 从左到右依次将实际 宽度小于宽度阈值的连续第二连通域合并, 得到 完整连通域; 根据完整连通域进行字符识别。 本 发明以连通域为基础分别对手写字符进行纵向 和横向合并, 能够在去除粘 连字符影 响的同时有 效提高分割的准确率。 权利要求书2页 说明书8页 附图2页 CN 115410209 A 2022.11.29 CN 115410209 A 1.一种基于图像处 理的煤矿工单识别方法, 其特 征在于, 包括: 对煤矿工单进行扫描得到煤矿工单图像, 获取煤矿工单图像中每个单元格手写字符区 域的连通 域并作为第一连通 域; 对每个单元格手写字符区域中的第 一连通域进行垂直投影, 并利用每个单元格手写字 符区域中每 个第一连通 域的垂直投影进行曲线拟合得到每 个单元格的拟合曲线; 根据每个单元格的拟合曲线对每个单元格手写字符区域中的第 一连通域进行分割, 得 到每个单元格手写字符区域中的多个第二连通 域; 获取每个单元格手写字符区域中每个第 二连通域的实际宽度, 并从左 到右依次将 实际 宽度小于宽度阈值的连续第二连通域合并, 得到每个单元格手写字符区域中的多个完整连 通域; 将得到的多个完整连通域输入到神经网络中, 输出为每个单元格手写字符区域中的字 符。 2.根据权利要求1所述的一种基于图像处理 的煤矿工单识别方法, 其特征在于, 获取煤 矿工单图像中每 个单元格手写字符区域的连通 域并作为第一连通 域的方法为: 获取煤矿工单图像中每个单元格中的手写字符区域, 并对每个单元格的手写字符区域 进行连通域分析, 得到每 个单元格手写字符区域中的多个连通 域; 根据每个单元格手写字符区域中的连通域的像素点横坐标范围将每个单元格手写字 符区域中的连通 域进行合并; 将合并后每 个单元格手写字符区域中的连通 域作为第一连通 域。 3.根据权利要求2所述的一种基于图像处理 的煤矿工单识别方法, 其特征在于, 将每个 单元格中的连通 域进行合并的方法为: 获取每个单元格手写字符区域中的各个连通 域的像素点横坐标 范围; 从左到右依次获取两两连通域中像素点横坐标范围的交集, 并获取对应两两连通域中 像素点横坐标 范围最大值; 判断两两连通域中像素点横坐标范围的交集与对应两两连通域中像素点横坐标范围 最大值的比值是否大于阈值; 将比值大于 阈值的对应两两连通域进行合并, 并以该合并后的连通域为新的连通域继 续进行合并, 直至该比值小于阈值; 以比值小于 阈值时对应的连通域开始重新进行合并, 直至单元格中不存在可以合并的 连通域。 4.根据权利要求1所述的一种基于图像处理 的煤矿工单识别方法, 其特征在于, 对每个 单元格手写字符区域中的第一连通 域进行分割的方法为: 对每个单元格手写字符区域中的每个第 一连通域进行垂直投影, 并获取每个第 一连通 域垂直投影对应的拟合曲线; 当第一连通域垂直投影对应的拟合曲线存在多个波峰时, 根据两两波峰之间的波谷点 在对应第一连通 域中的位置对该第一连通 域进行分割。 5.根据权利要求1所述的一种基于图像处理 的煤矿工单识别方法, 其特征在于, 从左 到 右依次将实际宽度小于 宽度阈值的连续第二连通 域合并的方法为:权 利 要 求 书 1/2 页 2 CN 115410209 A 2从左到右获取每个单元格手写字符区域中的第 一个第二连通域的实际宽度 , 当该第 二连通域的实际宽度小于宽度阈值时, 将第一个第二连通域与第二个第二连通域进行合 并, 获取合并后连通 域的实际宽度 ; 当合并后连通域的实际宽度 大于宽度阈值时, 将该合并后的连通域作为对应单元 格手写字符区域的完整连通域, 并从该单元格手写字符区域的第三个第二连通域开始继续 进行合并, 直至得到每 个单元格手写字符区域的所有完整连通 域。 6.根据权利要求5所述的一种基于图像处理 的煤矿工单识别方法, 其特征在于, 从左 到 右依次将实际宽度小于 宽度阈值的连续第二连通 域合并时, 还 包括: 当合并后连通域的实际宽度 小于宽度阈值时, 获取第三个第二连通域的实际宽度 ; 若第三个第二连通域的实际宽度 大于宽度阈值, 将该合并后连通域作为完整连通 域; 若第三个第二连通域的实际宽度 小于宽度阈值, 从水平方向上任意选取十条同时通 过第二个、 第三个以及第四个第二连通域的直线, 分别获取十条直线中第二个第二连通域 与第三个第二连通域之 间的距离之和 , 以及第三个第二连通域与第四个第二连通域之间 的距离之和 ; 当 时, 将该合并后连通 域与第三个第二连通 域进行合并, 得到 完整连通 域; 当 时, 该合并后连通域作为完整连通域, 并从第三个第二连通域开始重新进行 合并。 7.根据权利要求5所述的一种基于图像处理 的煤矿工单识别方法, 其特征在于, 从左 到 右依次将实际宽度小于 宽度阈值的连续第二连通 域合并时, 还 包括: 当第一个第二连通域的实际宽度大于宽度阈值, 且第 二个第二连通域的实际宽度也大 于宽度阈值时, 将第一个第二连通 域作为完整连通 域; 当单元格手写字符区域中每个第二连通域及其相邻两个第二连通域的实际宽度均大 于宽度阈值时, 将该第二连通 域作为完整连通 域。 8.根据权利要求1所述的一种基于图像处理 的煤矿工单识别方法, 其特征在于, 根据每 个单元格手写字符区域中的多个完整连通 域进行字符识别的方法为: 建立手写字符数据库, 并利用数据库中的手写字符对卷积神经网络进行训练; 利用训练好的卷积神经网络对煤矿工单中每个单元格手写字符区域中的多个完整连 通域进行字符识别。权 利 要 求 书 2/2 页 3 CN 115410209 A 3

PDF文档 专利 一种基于图像处理的煤矿工单识别方法

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于图像处理的煤矿工单识别方法 第 1 页 专利 一种基于图像处理的煤矿工单识别方法 第 2 页 专利 一种基于图像处理的煤矿工单识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:58:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。