(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211365487.4 (22)申请日 2022.11.03 (71)申请人 合肥中科类脑智能技 术有限公司 地址 230088 安徽省合肥市高新区望江西 路5089号中国科大先进技术研究院一 号嵌入式研发楼3楼 (72)发明人 沈韬 康凯 孙俊 孙涛 艾坤  刘海峰 王子磊  (74)专利代理 机构 合肥昊晟德专利代理事务所 (普通合伙) 3415 3 专利代理师 何梓秋 (51)Int.Cl. G06V 40/20(2022.01) G06V 40/10(2022.01) G06V 10/82(2022.01)G06V 10/764(2022.01) G06V 10/26(2022.01) (54)发明名称 一种基于人体朝向判断的钓鱼行为检测方 法 (57)摘要 本发明公开了一种基于人体朝向判 断的钓 鱼行为检测方法, 属于钓鱼行为检测技术领域。 本发明结合人体朝向判断模型分析得出行人的 朝向, 根据行人的朝向来调整裁剪方式, 从而尽 可能多的将鱼竿部分裁剪下来; 按语义分割的方 法标注图片中鱼竿的多边形, 再用图像修复算法 去除图片中的鱼竿, 去除鱼竿的图片作为负样 本, 能够更好的让模型专注于鱼竿的信息, 提高 模型学习的准确率, 获得效果更好的分类模型; 在传统分类模 型的基础上, 添加一个 鱼竿分割的 分支, 让网络可以更专注到鱼竿的信息, 推理时 无需对鱼竿 等进行语义分割, 也无需复杂的后处 理, 避免分割不准、 后处理逻辑不对导致的误判, 在复杂场景有较高的检测精度。 权利要求书2页 说明书7页 附图5页 CN 115410280 A 2022.11.29 CN 115410280 A 1.一种基于人体朝向判断的钓鱼行为检测方法, 其特 征在于, 包括以下步骤: 步骤S1: 行 人检测 通过行人检测模型对监控视频中待检测图片进行逐帧检测, 判断图片中是否有人, 如 果没有, 则返回继续检测下一张图片, 如果有人, 则输出 行人框; 步骤S2: 钓鱼行为分析 将步骤S1中的行人框从待检测图片中裁剪下来, 输入到人体朝向判断模型中, 判断行 人朝向, 并根据行 人朝向的判断结果按对应方向对行 人框的大小 进行扩充; 根据扩充后的行人框的范围将行人图片 从待检测图片中裁剪下来, 输入到钓鱼行为判 断模型中, 判断是否存在钓鱼行为; 在所述步骤S1中, 行人框坐标记为 (x,y,w,h) , 其中, x、 y为行人框任一边角点在图片中 的x轴和y轴坐标, w表示行 人框的宽度, h表示行 人框的高度, x ‑y两轴坐标系为像素坐标系; 所述步骤S2的具体处 理过程如下: 步骤S21: 根据步骤S1中行人检测模型输出的行人框坐标将行人图片从待检测图片中 裁剪下来, 输入到人体朝向判断模型中; 步骤S22: 根据步骤S21中判断模型判断的行人人体的沿水平方向的左右朝向, 在步骤 S1中行人框的基础上, 将宽沿人体朝向方向侧扩充2n倍, 高向上扩充n倍; 若无法判断出行 人的左右朝向, 则将行 人框往左、 右和上三个方向扩充n 倍, 其中n 为正数; 步骤S23: 调整后的行人框坐标记作 , 根据调整后的行人框坐标将行人图片 从待检测图片中裁 剪下来, 输入到钓鱼行为判断模型中, 判断是否存在钓鱼行为。 2.根据权利要求1所述的一种基于人体朝向判断的钓鱼行为检测方法, 其特征在于: 在 所述步骤S1中, 所述行 人检测模型基于 YOLOv5s网络实现。 3.根据权利要求1所述的一种基于人体朝向判断的钓鱼行为检测方法, 其特征在于: 在 所述步骤S21中, 人体朝向判断模 型是一个三分类模型, 分类结果分别是人体的3个朝向, 即 左、 右和其 他。 4.根据权利要求1所述的一种基于人体朝向判断的钓鱼行为检测方法, 其特征在于: 在 所述步骤S21中, 人体朝向判断模型的训练过程如下: 步骤S211: 获取大量含有人的数据图片, 将图片中人的朝向按照左、 右、 其他三种类别 进行语义分类标注; 步骤S212: 将步骤S211中标注完成的数据集投入到训练网络中, 训练网络的主干网络 使用resnet5 0, 损失函数采用交叉熵损失函数, 训练完成后即可获得 人体朝向判断模型。 5.根据权利要求1所述的一种基于人体朝向判断的钓鱼行为检测方法, 其特征在于: 在 所述步骤S23中, 钓鱼行为判断模型的训练过程如下: 步骤S231: 所有的原始图片均包含有人的数据图片, 将含有鱼竿的图片进行语义分割, 标注图片 中鱼竿的多边形, 按照步骤S2中图片裁剪方式, 将图片 中的人从原始图片中裁剪 出来, 形成数据集; 步骤S232: 将数据集中有钓鱼行为的图片作为正样本, 无钓鱼行为的图片作为负样本, 并在正样本中增 加类似鱼竿的噪声, 然后进行 数据增强处 理; 步骤S233: 将经过步骤S232处理的数据集投入到训练网络中, 训练网络的主干网络使权 利 要 求 书 1/2 页 2 CN 115410280 A 2用resnet5 0, 损失函数采用多任务损失函数, 训练完成后即可获得钓鱼行为判断模型。 6.根据权利要求5所述的一种基于人体朝向判断的钓鱼行为检测方法, 其特征在于: 在 所述步骤S232中, 数据增强处理包括多尺度变换、 旋转、 翻转增强处理, 以及通过图像修复 算法去除正样本中被 语义分割标注出的鱼竿, 将去除鱼竿的图片当做负 样本。 7.根据权利要求5或6所述的一种基于人体朝向判断的钓鱼行为检测方法, 其特征在 于: 在所述步骤S233中, 所述钓鱼行为判断模 型的输出有两个 分支, 其中一个 分支是分类分 支, 另一个分支是语义分割的分支, 两个分支共享主干网络; 其中, 分类分支输出的是二分 类, 语义分割的分支输出的是鱼竿分割结果, 语义分割分支仅参与训练, 不 参与检测过程。权 利 要 求 书 2/2 页 3 CN 115410280 A 3

PDF文档 专利 一种基于人体朝向判断的钓鱼行为检测方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于人体朝向判断的钓鱼行为检测方法 第 1 页 专利 一种基于人体朝向判断的钓鱼行为检测方法 第 2 页 专利 一种基于人体朝向判断的钓鱼行为检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。