(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211000080.1 (22)申请日 2022.08.19 (71)申请人 广州欢聚时代信息科技有限公司 地址 511400 广东省广州市番禺区南村镇 万博二路79 号万博商务区万达商业广 场北区B-1栋23层 (72)发明人 王博锐  (74)专利代理 机构 深圳市智圈知识产权代理事 务所(普通 合伙) 44351 专利代理师 林炮勤 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/289(2020.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 标签分类、 装置、 电子设备及存 储介质 (57)摘要 本申请公开了一种标签分类方法、 装置、 电 子设备及存储介质。 方法包括: 通过标签分类模 型对待分类信息进行特征提取, 得到隐蔽态特征 信息; 对隐蔽态特征信息进行矩阵投影处理, 得 到多个预设标签 分别对应的预测概率; 将每个预 设标签的预测概率 以及与每个预设标签对应的 最优阈值的进行比对, 得到对应每个预设标签的 比对结果; 根据每个预设标签的比对结果, 得到 待分类信息的标签分类结果。 本申请中, 由于不 同预设标签对应各自的最优阈值, 使得各个预设 标签对应的比对 结果的准确率较高, 从而提高了 标签分类结果的准确率。 权利要求书2页 说明书12页 附图4页 CN 115292497 A 2022.11.04 CN 115292497 A 1.一种标签分类方法, 其特 征在于, 所述方法包括: 通过标签分类模型对待分类信息进行 特征提取, 得到隐蔽态特 征信息; 对所述隐蔽态特征信息进行矩阵投影处理, 得到多个预设标签分别对应的预测概率, 每个预设标签的预测概 率表征所述待分类信息属于每 个预设标签的概 率; 将每个所述预设标签的预测概率以及与每个所述预设标签对应的最优阈值的进行比 对, 得到对应 每个所述预设标签的比对结果, 所述多个预设标签各自对应有最优阈值; 根据每个所述预设标签的比对结果, 得到所述待分类信息的标签分类结果。 2.根据权利要求1所述的方法, 其特征在于, 所述多个预设标签各自对应的最优阈值的 获取方法包括: 通过所述标签分类模型对样本分类信息进行 特征提取, 得到样本隐蔽态特 征信息; 对所述样本隐蔽态特征信 息进行矩阵投影处理, 得到所述多个预设标签分别对应的样 本预测概率, 每个预设标签的样本预测概率表征所述样本 分类信息属于每个预设标签的概 率; 根据每个所述预设标签分别对应的样本预测概率, 获得每个所述预设标签各自对应的 最优阈值。 3.根据权利要求2所述的方法, 其特征在于, 所述根据每个所述预设标签分别对应的样 本预测概 率, 获得每 个所述预设标签各自对应的最优阈值, 包括: 确定对应 每个所述预设标签的多个第一阈值以及第一评估指标; 根据所述多个第一阈值以及第一评估指标, 确定目标阈值, 所述确定目标阈值的过程 包括: 将所述多个第一阈值中的一个第一阈值作为第二阈值, 根据所述第二阈值, 计算每个 所述预设标签对应的第二评估指标; 若所述第二评估指标高于所述第 一评估指标, 将所述第 二评估指标作为新的第 一评估 指标, 并将所述第二阈值作为目标阈值; 重复所述确定目标阈值的过程, 直到遍历所述多个第一阈值, 将每个所述预设标签对 应的最后一个目标阈值作为每 个所述预设标签对应的最优阈值。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述第二阈值, 计算每个所述预 设标签对应的第二评估指标, 包括: 获取所述样本分类信 息的标注信 息, 所述标注信 息包括每个所述预设标签对应的标注 信息; 根据对应每个所述预设标签的第 二阈值以及样本预测概率, 确定每个所述预设标签的 分类结果; 根据对应每个所述预设标签的标注信 息以及分类结果, 得到对应每个所述预设标签的 第二评估指标。 5.根据权利要求3所述的方法, 其特征在于, 所述确定对应每个所述预设标签的多个第 一阈值以及第一评估指标, 包括: 确定对应 每个所述预设标签的最大阈值、 最小阈值以及搜索步长; 根据对应每个所述预设标签的最大阈值、 最小阈值以及搜索步长, 确定对应每个所述 预设标签的多个第一阈值;权 利 要 求 书 1/2 页 2 CN 115292497 A 2将预设数值作为对应 每个所述预设标签的第一评估指标。 6.根据权利要求1至5任一项所述的方法, 其特征在于, 所述通过标签分类模型对待分 类信息进行 特征提取, 得到隐蔽态特 征信息, 包括: 对所述待分类信息进行分词操作, 得到多个分词; 对所述多个分词进行向量编码, 得到编码结果; 通过所述标签分类模型对所述编码结果进行 特征提取, 得到所述隐蔽态特 征信息。 7.根据权利要求1至5任一项所述的方法, 其特征在于, 所述根据每个所述预设标签的 比对结果, 得到所述待分类信息的标签分类结果, 包括; 若所述预设标签的比对结果为预测概率大于最优阈值, 将所述预设标签作为选定预设 标签; 将所述选 定标签汇总, 得到所述待分类信息的标签分类结果。 8.一种标签分类装置, 其特 征在于, 所述装置包括: 提取模块, 用于通过 标签分类模型对待分类信息进行 特征提取, 得到隐蔽态特 征信息; 概率获得模块, 用于对所述 隐蔽态特征信息进行矩阵投影处理, 得到多个预设标签分 别对应的预测概率, 每个预设标签的预测概率表征所述待分类信息属于每个预设标签的概 率; 比对模块, 用于将每个所述预设标签的预测概率以及与每个所述预设标签对应的最优 阈值的进行比对, 得到对应每个所述预设标签的比对结果, 所述多个预设标签各自对应有 最优阈值; 结果获得模块, 用于根据每个所述预设标签的比对结果, 得到所述待分类信息的标签 分类结果。 9.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储器; 一个或多个应用程序, 其中所述一个或多个应用程序被存储在所述存储器中并被配置 为由所述一个或多个处理器执行, 所述一个或多个程序配置用于执行如权利要求1 ‑7中任 一项所述的方法。 10.一种计算机可读取存储介质, 其特征在于, 所述计算机可读取存储介质中存储有程 序代码, 所述 程序代码可被处 理器调用执 行如权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115292497 A 3

.PDF文档 专利 标签分类、装置、电子设备及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 标签分类、装置、电子设备及存储介质 第 1 页 专利 标签分类、装置、电子设备及存储介质 第 2 页 专利 标签分类、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:15:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。