(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210135879.5
(22)申请日 2022.02.15
(65)同一申请的已公布的文献号
申请公布号 CN 114201973 A
(43)申请公布日 2022.03.18
(73)专利权人 深圳博士创新 技术转移有限公司
地址 518000 广东省深圳市南 山区粤海街
道科技园粤兴三道2号虚拟大学园产
业化综合楼 A702
(72)发明人 张建明 王海灵
(74)专利代理 机构 广州博联知识产权代理有限
公司 44663
专利代理师 梁志标
(51)Int.Cl.
G06F 40/30(2020.01)G06K 9/62(2022.01)
(56)对比文件
CN 108228665 A,2018.0 6.29
CN 111159630 A,2020.0 5.15
CN 110399505 A,2019.1 1.01
CN 113392315 A,2021.09.14
CN 110795565 A,2020.02.14
WO 2017157198 A1,2017.09.21
审查员 黄长霞
(54)发明名称
基于人工智能的资源池对象数据挖掘方法
及系统
(57)摘要
本申请提供的基于人工智能的资源池对象
数据挖掘方法及系统, 基于设定技术标签的对象
语义提取数据的有效语义向量数量确定设定技
术标签的对象语义提取数据的技术匹配性, 基于
技术匹配性挖掘设定对象标签的分析情况, 从而
对设定对象标签的分析情况进行提取, 使对象数
据挖掘系统依照标准在设定对象标签中部署设
定技术标签的对象语义提取数据, 确保对象挖掘
的准确性。 本申请能够通过AI模型和对象数据处
理技术实现设定对象标签的技术匹配性智能提
取, 从而提高提取完整度和可靠性。
权利要求书2页 说明书15页 附图2页
CN 114201973 B
2022.06.07
CN 114201973 B
1.一种基于人工智能的资源池对象数据挖掘方法, 其特征在于, 应用于对象数据挖掘
系统, 所述方法至少包括:
查找目标对象数据, 所述目标对象数据包括设定对象标签 中的M个对象语义提取数据,
M为正整数;
将所述目标对象数据解析为M个单元对象数据, 每个单元对象数据包括一个对象语义
提取数据;
对于每个单元对象数据, 基于所述单元对象数据的第 一技术语义向量序列和参考对象
数据的第二技术语义向量序列, 确定所述单元对象数据中的对象语义提取数据是否为设定
技术标签的对象语义提取数据; 其中, 所述参考对象数据是事 先用于进 行比较配置的, 且所
述参考对象数据包括设定技 术标签的对象语义 提取数据;
基于设定技术标签的对象语义提取数据的有效语义向量数量确定所述设定技术标签
的对象语义 提取数据的技 术匹配性;
所述将所述目标对象数据解析为M个单 元对象数据, 包括:
将所述目标对象数据传递到完成权重指示优化的AI训练模型, 并基于所述AI训练模型
分别游走所述目标对象数据的每个对象段落数据, 并确定所述对象段落数据的对象语义向
量是否对应有技术标签属 性, 如果确定是, 则将所述对 象段落数据解析为一个单元对 象数
据; 其中, 在AI训练模 型的模型权重指示优化流程中, 将参考对象标定数据序列传递到AI训
练模型, 所述参考对 象标定数据序列包括多个参考对 象数据, 所述参考对 象数据包括设定
对象标签中的不少 于一个对 象语义提取数据, 每个对 象语义提取数据具有记录 向量信息,
所述记录向量信息标定有技术标签属性, 以使A I训练模型基于所述参考对象标定数据序列
进行模型权重指示优化, 得到记录向量信息的对象语义向量与技术标签属性的关联学习向
量;
所述基于所述单元对象数据的第一技术语义向量序列和参考对象数据的第二技术语
义向量序列, 确定所述单元对象数据中的对象语义提取数据是否为设定技术标签的对象语
义提取数据, 包括:
如果事先用于进行比较配置的参考对象数据的数量为不少于两个, 确定所述单元对象
数据的第一 技术语义向量序列 与每个参考对象数据的第二 技术语义向量序列的匹配程度;
如果最大匹配程度大于预设匹配程度, 则确定所述单元对象数据中的对象语义提取数
据为所述 最大匹配程度对应的参 考对象数据中的设定技 术标签的对象语义 提取数据;
所述单元对象数据的第一 技术语义向量序列的提取步骤, 包括:
获取所述单元对象数据的对象语句分段数据, 获取所述单元对象数据的对象关键词联
系数据;
基于所述单元对象数据的对象语句分段数据和所述单元对象数据的对象关键词联系
数据, 确定所述单 元对象数据的第一 技术语义向量序列;
所述参考对象数据的第二 技术语义向量序列的提取步骤, 包括:
获取参考对象数据的对象语句分段 数据, 获取参 考对象数据的对象关键词联系数据;
基于参考对象数据的对象语句分段数据和参考对象数据的对象关键词联系数据, 确定
所述参考对象数据的第二 技术语义向量序列;
所述预设匹配程度的提取步骤, 包括:权 利 要 求 书 1/2 页
2
CN 114201973 B
2确定参考对象语义提取数据对象数据的技术语义向量序列与参考对象数据的技术语
义向量序列的第一匹配程度;
确定参考对象标定数据的技术语义向量序列与参考对象数据的技术语义向量序列的
第二匹配程度;
基于所述第 一匹配程度和所述第 二匹配程度确定所述预设匹配程度, 所述预设匹配程
度小于所述第一匹配程度, 所述预设匹配程度大于所述第二匹配程度; 其中, 所述参考对象
语义提取数据对象数据中的设定技术标签的对 象语义提取数据与所述参考对 象数据中的
设定技术标签的对象语义 提取数据相同;
所述参考对象标定数据未包括设定技术标签的对象语义提取数据, 或者, 所述参考对
象标定数据中的设定技术标签的对 象语义提取数据与所述参考对 象数据中的设定技术标
签的对象语义 提取数据不同;
所述查找目标对象数据包括:
从对象数据挖掘系统获取基础对象数据, 所述基础对象数据包括设定对象标签中的M
个对象语义 提取数据;
确定所述基础对象数据中的对象语义 提取数据是否无效;
如果确定 否, 则将所述基础对象数据确定为所述目标对象数据;
如果确定是, 则提 示所述对象数据 挖掘系统再次获取基础对象数据;
所述确定所述基础对象数据中的对象语义 提取数据是否无效, 包括:
基于所述基础对象数据和公告对象数据确定差异对象数据; 其中, 所述公告对象数据
是所述设定对象标签中未包括对象语义 提取数据时解析到的对象数据;
将所述基础对象数据解析为M个单元对象数据, 每个单元对象数据包括一个对象语义
提取数据, 并确定所述M个单 元对象数据对应的联系对象数据;
确定所述差异对象数据与所述联系对象数据的关联信息;
基于所述关联信息确定所述基础对象数据中的对象语义 提取数据是否无效。
2.一种基于人工智能的资源池对象数据挖掘系统, 其特征在于, 包括互相之间通信的
处理器和存储器, 所述处理器用于从所述存储器中调取计算机程序, 并通过运行所述计算
机程序实现权利要求1所述的方法。权 利 要 求 书 2/2 页
3
CN 114201973 B
3
专利 基于人工智能的资源池对象数据挖掘方法及系统
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:35上传分享