standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210101886.3 (22)申请日 2022.01.27 (71)申请人 招商银行股份有限公司 地址 518000 广东省深圳市福田区深南大 道7088招商银行 大厦 (72)发明人 杨一枭 蒲珂宇 刘弘一 季江舟  贺瑶函  (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 李幸芳 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/258(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 实体类型推断方法、 系统、 装置、 终端设备以 及存储介质 (57)摘要 本发明公开了一种实体类型推断方法、 系 统、 装置、 终端设备以及存储介质, 通过 获取待推 断数据; 提取所述待推断数据的主次特征; 将所 述主次特征输入预先建立的实体类型推断模型 中进行推断, 得到预测结果, 其中, 所述实体类型 推断模型包括多标签分类模型与单标签分类模 型; 根据所述预测结果进行半数投票, 得到所述 待推断数据的类型结果。 本发明改善了实体类型 推断的效果。 权利要求书2页 说明书9页 附图3页 CN 114443861 A 2022.05.06 CN 114443861 A 1.一种实体 类型推断方法, 其特 征在于, 所述实体 类型推断方法包括以下步骤: 获取待推断数据; 提取所述待推断数据的主次特 征; 将所述主次特征输入预先建立的实体类型推断模型中进行推断, 得到预测结果, 其中, 所述实体 类型推断模型包括多标签分类模型与单 标签分类模型; 根据所述预测结果进行半数投票, 得到所述待推断数据的类型 结果。 2.如权利要求1所述的实体类型推断方法, 其特征在于, 所述获取待推断数据的步骤之 前还包括: 建立所述实体 类型推断模型, 具体包括: 获取预先采集的数据集, 并根据所述数据集得到初版模型; 基于所述初版模型与所述数据集, 修 正增强得到训练集; 提取所述训练集中各训练数据的主体特征, 其中, 各所述训练数据的主体特征包括实 体名、 实体标题以及实体描述文本; 对所述实体描述文本进行摘要抽取, 得到补充特 征; 通过预训练模型将所述主体特 征与所述补充特 征转化并融合 为向量; 结合快速梯度 上升对抗训练对所述向量进行多标签与 单标签分类训练, 得到各所述多 标签分类模型与各所述单标签分类模型, 由各所述多标签分类模型与各所述单标签分类模 型构成所述实体 类型推断模型。 3.如权利要求2所述的实体类型推断方法, 其特征在于, 所述获取预先采集的数据集, 并根据所述数据集得到初版模型的步骤 包括: 获取预先采集的数据集; 从所述数据集中随机 选取若干条 数据进行实体 类型标注, 得到标注数据; 根据所述标注数据训练得到所述初版模型。 4.如权利要求2所述的实体类型推断方法, 其特征在于, 所述基于所述初版模型与 所述 数据集, 修 正增强得到训练集的步骤 包括: 从所述数据集中选取若干条实体数据; 基于所述初版模型对所述实体数据进行推断, 得到推断结果; 对所述推断结果进行修 正增强, 得到所述训练集。 5.如权利要求2所述的实体类型推断方法, 其特征在于, 所述提取所述待推断数据的主 次特征的步骤 包括: 提取所述待推断数据的主体特 征; 将所述待推断数据的主体特征与 所述补充特征进行匹配, 得到所述待推断数据的次要 特征; 将所述待推断数据的主体特 征与所述次要特 征作为所述待推断数据的主次特 征。 6.如权利要求1所述的实体类型推断方法, 其特征在于, 所述根据 所述预测结果进行半 数投票, 得到所述待推断数据的类型 结果的步骤 包括: 判断所述预测结果是否为多个标签; 若所述预测结果为多个标签, 则使用各所述多标签模型进行半数投票, 得到所述待推 断数据的类型 结果;权 利 要 求 书 1/2 页 2 CN 114443861 A 2若所述预测结果不为多个标签, 即所述预测结果为单个标签, 则使用各所述多标签模 型与各所述单标签模型进行半数投票, 得到所述待推断数据的类型 结果。 7.一种实体 类型推断系统, 其特 征在于, 所述实体 类型推断系统包括: 数据处理层, 用于获取待推断数据; 特征提取层, 用于提取 所述待推断数据的主次特 征; 模型训练层, 用于训练得到实体类型推断模型, 以供将所述主次特征输入所述实体类 型推断模型中进行推断, 得到预测结果; 模型融合层, 用于根据所述预测结果进行半数投票, 得到所述待推断数据的类型 结果。 8.一种实体 类型推断装置, 其特 征在于, 所述实体 类型推断装置包括: 获取模块, 用于获取待推断数据; 特征提取模块, 用于提取 所述待推断数据的主次特 征; 预测模块, 用于将所述主次特征输入预先建立的实体类型推断模型中进行推断, 得到 预测结果, 其中, 所述实体 类型推断模型包括多标签分类模型与单 标签分类模型; 投票模块, 用于根据所述预测结果进行半数投票, 得到所述待推断数据的类型 结果。 9.一种终端设备, 其特征在于, 所述终端设备包括存储器、 处理器及存储在所述存储器 上并可在所述处理器上运行的实体类型推断程序, 所述 实体类型推断程序被所述处理器执 行时实现如权利要求1 ‑6中任一项所述的实体 类型推断方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有实体类 型推断程序, 所述实体类型推 断程序被处理器执行时实现如权利要求1 ‑6中任一项所述的 实体类型推断方法的步骤。权 利 要 求 书 2/2 页 3 CN 114443861 A 3

PDF文档 专利 实体类型推断方法、系统、装置、终端设备以及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 实体类型推断方法、系统、装置、终端设备以及存储介质 第 1 页 专利 实体类型推断方法、系统、装置、终端设备以及存储介质 第 2 页 专利 实体类型推断方法、系统、装置、终端设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:42上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。