standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210101886.3 (22)申请日 2022.01.27 (71)申请人 招商银行股份有限公司 地址 518000 广东省深圳市福田区深南大 道7088招商银行 大厦 (72)发明人 杨一枭 蒲珂宇 刘弘一 季江舟 贺瑶函 (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 李幸芳 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/258(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 实体类型推断方法、 系统、 装置、 终端设备以 及存储介质 (57)摘要 本发明公开了一种实体类型推断方法、 系 统、 装置、 终端设备以及存储介质, 通过 获取待推 断数据; 提取所述待推断数据的主次特征; 将所 述主次特征输入预先建立的实体类型推断模型 中进行推断, 得到预测结果, 其中, 所述实体类型 推断模型包括多标签分类模型与单标签分类模 型; 根据所述预测结果进行半数投票, 得到所述 待推断数据的类型结果。 本发明改善了实体类型 推断的效果。 权利要求书2页 说明书9页 附图3页 CN 114443861 A 2022.05.06 CN 114443861 A 1.一种实体 类型推断方法, 其特 征在于, 所述实体 类型推断方法包括以下步骤: 获取待推断数据; 提取所述待推断数据的主次特 征; 将所述主次特征输入预先建立的实体类型推断模型中进行推断, 得到预测结果, 其中, 所述实体 类型推断模型包括多标签分类模型与单 标签分类模型; 根据所述预测结果进行半数投票, 得到所述待推断数据的类型 结果。 2.如权利要求1所述的实体类型推断方法, 其特征在于, 所述获取待推断数据的步骤之 前还包括: 建立所述实体 类型推断模型, 具体包括: 获取预先采集的数据集, 并根据所述数据集得到初版模型; 基于所述初版模型与所述数据集, 修 正增强得到训练集; 提取所述训练集中各训练数据的主体特征, 其中, 各所述训练数据的主体特征包括实 体名、 实体标题以及实体描述文本; 对所述实体描述文本进行摘要抽取, 得到补充特 征; 通过预训练模型将所述主体特 征与所述补充特 征转化并融合 为向量; 结合快速梯度 上升对抗训练对所述向量进行多标签与 单标签分类训练, 得到各所述多 标签分类模型与各所述单标签分类模型, 由各所述多标签分类模型与各所述单标签分类模 型构成所述实体 类型推断模型。 3.如权利要求2所述的实体类型推断方法, 其特征在于, 所述获取预先采集的数据集, 并根据所述数据集得到初版模型的步骤 包括: 获取预先采集的数据集; 从所述数据集中随机 选取若干条 数据进行实体 类型标注, 得到标注数据; 根据所述标注数据训练得到所述初版模型。 4.如权利要求2所述的实体类型推断方法, 其特征在于, 所述基于所述初版模型与 所述 数据集, 修 正增强得到训练集的步骤 包括: 从所述数据集中选取若干条实体数据; 基于所述初版模型对所述实体数据进行推断, 得到推断结果; 对所述推断结果进行修 正增强, 得到所述训练集。 5.如权利要求2所述的实体类型推断方法, 其特征在于, 所述提取所述待推断数据的主 次特征的步骤 包括: 提取所述待推断数据的主体特 征; 将所述待推断数据的主体特征与 所述补充特征进行匹配, 得到所述待推断数据的次要 特征; 将所述待推断数据的主体特 征与所述次要特 征作为所述待推断数据的主次特 征。 6.如权利要求1所述的实体类型推断方法, 其特征在于, 所述根据 所述预测结果进行半 数投票, 得到所述待推断数据的类型 结果的步骤 包括: 判断所述预测结果是否为多个标签; 若所述预测结果为多个标签, 则使用各所述多标签模型进行半数投票, 得到所述待推 断数据的类型 结果;权 利 要 求 书 1/2 页 2 CN 114443861 A 2若所述预测结果不为多个标签, 即所述预测结果为单个标签, 则使用各所述多标签模 型与各所述单标签模型进行半数投票, 得到所述待推断数据的类型 结果。 7.一种实体 类型推断系统, 其特 征在于, 所述实体 类型推断系统包括: 数据处理层, 用于获取待推断数据; 特征提取层, 用于提取 所述待推断数据的主次特 征; 模型训练层, 用于训练得到实体类型推断模型, 以供将所述主次特征输入所述实体类 型推断模型中进行推断, 得到预测结果; 模型融合层, 用于根据所述预测结果进行半数投票, 得到所述待推断数据的类型 结果。 8.一种实体 类型推断装置, 其特 征在于, 所述实体 类型推断装置包括: 获取模块, 用于获取待推断数据; 特征提取模块, 用于提取 所述待推断数据的主次特 征; 预测模块, 用于将所述主次特征输入预先建立的实体类型推断模型中进行推断, 得到 预测结果, 其中, 所述实体 类型推断模型包括多标签分类模型与单 标签分类模型; 投票模块, 用于根据所述预测结果进行半数投票, 得到所述待推断数据的类型 结果。 9.一种终端设备, 其特征在于, 所述终端设备包括存储器、 处理器及存储在所述存储器 上并可在所述处理器上运行的实体类型推断程序, 所述 实体类型推断程序被所述处理器执 行时实现如权利要求1 ‑6中任一项所述的实体 类型推断方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有实体类 型推断程序, 所述实体类型推 断程序被处理器执行时实现如权利要求1 ‑6中任一项所述的 实体类型推断方法的步骤。权 利 要 求 书 2/2 页 3 CN 114443861 A 3
专利 实体类型推断方法、系统、装置、终端设备以及存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:42
上传分享
举报
下载
原文档
(536.2 KB)
分享
友情链接
DB3201-T 1125-2022 党政机关单位大型固定资产设施设备运维服务管理规范 南京市.pdf
DB35-T 1692-2017 水利风景区评价标准 福建省.pdf
T-CFA 0310021—2023 铸造企业规范条件.pdf
T-NIFA 9—2021 移动金融客户端应用软件安全检测规范.pdf
GB-T 34968-2017 地下水超采区评价导则.pdf
DB22-T 2581-2016 生物质成型燃料锅炉大气污染物排放标准 吉林省.pdf
GB-T 17808-2021 道路施工与养护机械设备 沥青混合料搅拌设备.pdf
GB-T 41680-2022 起重机 抗震设计通则.pdf
GB-T 24421.2-2023 服务业组织标准化工作指南 第2部分:标准体系构建.pdf
NB-T 10857-2021 水电工程合理使用年限及耐久性设计规范.pdf
DB14-T 1926—2019 石窟寺文物三维激光扫描数字化采集规程 山西省.pdf
T-CACM 1292—2019 中医内科临床诊疗指南 面瘫病.pdf
GB-T 4291-2017 冰晶石.pdf
T-HNJK 002—2019 保健用品生产质量管理规范.pdf
GB-T 20520-2006 信息安全技术 公钥基础设施 时间戳规范.pdf
GB-T 29551-2023 建筑用太阳能光伏夹层玻璃.pdf
中国联通 量子安全通信技术应用白皮书(2022).pdf
GB-T 22918-2008 易腐食品控温运输技术要求.pdf
T-CAMA 04—2019 植保无人飞机 安全操作规程.pdf
YD-T 4075-2022 以太网交换机多机虚拟化系统技术要求.pdf
1
/
15
评价文档
赞助2.5元 点击下载(536.2 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。