standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210658065.X (22)申请日 2022.06.10 (71)申请人 合肥工业大 学 地址 230009 安徽省合肥市屯溪路193号 (72)发明人 陆阳 赵明 杨帆 白婷 闻斌 张立 卫星 (74)专利代理 机构 上海汉之律师事务所 31378 专利代理师 冯华 (51)Int.Cl. G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 10/82(2022.01) G06V 10/74(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像描述模型的训练和描述方法、 系统、 设 备及存储介质 (57)摘要 本发明提供图像描述模型的训练和描述方 法、 系统、 设备及存储介质, 属于图像识别技术领 域。 图像描 述模型的训练方法包括: 获取训练集, 训练集包括带有标签的源域图像和不带标签的 目标域图像; 获取跨域图像描述模型, 跨域图像 描述模型包括风格迁移模块、 对比学习模块和目 标检测模块; 基于训练集对风格迁移模块、 对比 学习模块和目标检测模块进行联合训练, 获得训 练好的跨域图像描述模型, 跨域图像描述模型基 于源域图像的标签分类对具有目标域图像风格 的图像进行目标识别。 本发明能够最大化减小对 比损失以及源域和目标域之间的差异, 有效提升 了不同域下的检测能力, 不需对 人工采集的目标 域图像进行标注, 便能实现对目标域图像进行描 述。 权利要求书2页 说明书11页 附图8页 CN 115147644 A 2022.10.04 CN 115147644 A 1.一种跨 域图像描述模型的训练方法, 其特 征在于, 包括: 获取训练集, 所述训练集包括带有标签的源域图像和不带 标签的目标域图像; 获取跨域图像描述模型, 所述跨域图像描述模型包括风格迁移模块、 对比学习模块和 目标检测模块; 基于所述训练集对所述风格迁移模块、 对比学习模块和目标检测模块进行联合训练, 获得训练好的所述跨域图像描述模型, 所述跨域图像描述模型基于源域图像的标签分类对 具有目标域图像风格的图像进行目标识别。 2.根据权利要求1所述跨域图像描述模型的训练方法, 其特征在于, 所述基于所述训练 集对所述风格迁移模块、 对比学习模块和目标检测模块进行联合训练, 获得训练好的所述 跨域图像描述模型, 包括: 将所述训练集输入所述跨域图像描述模型, 获得所述风格迁移模块、 对比学习模块和 目标检测模块的损失函数, 计算得到所述 跨域图像描述模型总损失函数; 采用小批量随机梯度下降的方式, 将所述训练集按批次输入所述风格迁移模块、 对比 学习模块和目标检测模块进行迭代训练, 使所述总损失函数最小化, 获得训练好的跨域图 像描述模型。 3.根据权利要求2所述跨域图像描述模型的训练方法, 其特征在于, 所述将所述训练集 输入所述跨域图像描述模型, 获得所述风格迁移模块、 对比学习模块和目标检测模块的损 失函数, 计算得到所述 跨域图像描述模型总损失函数, 包括: 将所述训练集输入所述 跨域图像描述模型; 通过所述风格迁移模块对所述源域图像进行风格迁移, 将所述训练集中源域图像的风 格迁移为目标域图像风格, 根据带有目标域图像风格的源域图像与所述源域图像和目标域 图像的比对, 获得 所述风格迁移模块的第一损失函数Lneural; 通过所述对比学习模块的自监督对比学习, 获得所述训练集中图像的相似特征, 比对 特征获取所述对比学习模块的第二损失函数LNCE, 并基于所述源域图像的标签为具有相同 相似特征的所述目标域图像打上伪标签; 通过所述目标检测模块对所述训练集的图像进行目标识别, 获得对所述具有目标域图 像风格的源域图像和目标域图像的目标识别结果, 根据所述目标识别结果确定所述目标检 测模块的第三损失函数LSSD; 获得所述跨域图像描 述模型的总损失函数Ltotal, 所述总损失函数Ltotal为所述第一损失 函数Lneural、 第二损失函数LNCE和第三损失函数LSSD之和。 4.根据权利要求3所述跨域图像描述模型的训练方法, 其特征在于, 所述风格迁移模块 的第一损失函数Lneural为风格迁移时内容损失函数Lcontent和风格损失函数Lstyle的线性叠 加; 其中, 所述风格损失函数为所述 目标域图像和带有所述 目标域图像风格的源域图像之 间的风格特征之差, 所述内容损失函数Lcontent为所述源域图像和带有所述目标域图像风格 的源域图像之间的内容特 征之差。 5.根据权利要求3所述跨域图像描述模型的训练方法, 其特征在于, 所述通过所述对比 学习模块的自监督对比学习, 获得所述训练集中图像的相似特征, 比对特征获取所述对比 学习模块的第二损失函数LNCE, 并基于所述源域图像的标签为具有相同相 似特征的所述目 标域图像打上伪标签, 包括:权 利 要 求 书 1/2 页 2 CN 115147644 A 2对所述训练集中的图像进行两次锚点增强; 选取所述训练集中同一图像的两张锚点图像作为正样本, 将其他锚点图像作为负样 本; 对比所述正样本和 负样本, 计算获得所述对比学习模块的第二损失函数LNCE, 并获得所 述正样本对应图像的相似特 征; 根据所述训练集中图像的相似特征, 基于所述源域图像的标签为具有相同相似特征的 所述目标域图像打上伪标签。 6.根据权利要求3所述跨域图像描述模型的训练方法, 其特征在于, 所述通过所述目标 检测模块对所述训练集的图像进 行目标识别, 获得对所述具有目标域图像风格的源域图像 和目标域图像的目标识别结果, 根据所述目标识别结果确定所述目标检测模块的第三损失 函数LSSD, 包括: 通过所述目标检测模块的卷积神经网络提取所述训练集中图像的特征图, 获得所述训 练集中图像在不同卷积层下提取的特 征图; 使用卷积核对所述特征图进行检测, 获取所述训练集的图像中识别目标的定位信 息和 特征信息; 基于所述训练集中源域图像的标签和目标域图像的伪标签对齐所述训练集中图像的 特征信息, 获得 所述训练集中图像的分类信息; 基于所述训练集中图像的定位信 息和分类信 息, 计算获得所述目标检测模块的第 三损 失函数LSSD, 并获取所述训练集中图像的目标识别结果。 7.一种跨域图像描述方法, 其特征在于, 采用权利要求1至6任意一项所述跨域图像描 述模型的训练方法训练得到的跨 域图像描述模型, 所述 跨域图像描述方法包括: 获取图像数据; 将所述图像数据输入所述 跨域图像描述模型, 获取 所述图像数据的目标识别结果。 8.一种跨 域图像描述模型的训练系统, 其特 征在于, 包括: 数据获取单元, 用于获取训练集, 所述训练集包括带有标签的源域图像和不带标签的 目标域图像; 模型调用单元, 用于获取跨域图像描述模型, 所述跨域图像描述模型包括风格迁移模 块、 对比学习模块和目标检测模块; 联合训练单元, 基于所述训练集对所述风格迁移模块、 对比学习模块和目标检测模块 进行联合训练, 获得训练好的所述跨域图像描述模型, 所述跨域图像描述模型基于源域图 像的标签分类对具有目标域图像风格的图像进行目标识别。 9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计 算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至7中任一项所 述方法的步骤。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 115147644 A 3
专利 图像描述模型的训练和描述方法、系统、设备及存储介质
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:32:38
上传分享
举报
下载
原文档
(1.5 MB)
分享
友情链接
NIST 特别出版物 800 安全软件开发框架 (SSDF) 1.1 版:降低软件漏洞风险的建议o.pdf
GB-T 23703.7-2014 知识管理 第7部分:知识分类通用要求.pdf
DB32-T 3702-2019 江苏省日照分析技术规程 江苏省.pdf
GM-T 0013-2012 可信计算 可信密码模块符合性检测规范.pdf
DB63-T 1408-2015 甜椒设施育苗技术规范 青海省.pdf
DB15-T 1394-2018 软件工程项目价格测算规范 内蒙古自治区.pdf
GB-T 41800-2022 信息技术 传感器网络 爆炸危险化学品贮存安全监测系统技术要求.pdf
GB-T 15045-2013 脂肪烷基二甲基叔胺.pdf
GB-T 20822-2007 固液法白酒.pdf
GB-T 16427-2018 粉尘层电阻率测定方法.pdf
GB-T 30428.5-2017 数字化城市管理信息系统 第5部分:监管信息采集设备.pdf
DB11-T 2049-2022 政务大数据安全技术框架 北京市.pdf
GB-T 31496-2023 信息技术 安全技术 信息安全管理体系 指南.pdf
GB-T 13923-2022 基础地理信息要素分类与代码.pdf
GB-T 6653-2017 焊接气瓶用钢板和钢带.pdf
GB-T 19710.1-2023 地理信息 元数据 第1部分基础.pdf
GB-T 37830-2019 抗污易洁涂膜玻璃.pdf
T-GDIIA 005—2021 信息技术应用创新项目运行维护服务标准.pdf
DB22-T 3555-2023 眩晕综合征针刺治疗规范 吉林省.pdf
DB64-T 1961—2023 机关事务信息化系统服务规范 宁夏回族自治区.pdf
1
/
22
评价文档
赞助2.5元 点击下载(1.5 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。