standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210047822.X (22)申请日 2022.01.17 (71)申请人 中国科学技术大学 地址 230026 安徽省合肥市包河区金寨路 96号 (72)发明人 陈恩红 刘淇 陈彦敏 王皓  黄振亚  (74)专利代理 机构 北京凯特来知识产权代理有 限公司 1 1260 代理人 郑立明 韩珂 (51)Int.Cl. G06F 16/332(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) G06F 16/35(2019.01)G06Q 30/02(2012.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 关系感知相似问题识别评估方法、 系统、 设 备及存储介质 (57)摘要 本发明公开了一种关系感知相似问题识别 评估方法、 系统、 设备及存储介质, 相关方案使用 基于关系感知神经网络相似问题识别模型来进 行问题对的相似问题识别, 相比于传统模型, 使 用了多个语义匹配的语义关系相关信息。 对于预 测的结果, 在多个 评价指标上有一定的提高。 权利要求书3页 说明书8页 附图2页 CN 114416947 A 2022.04.29 CN 114416947 A 1.一种关系感知的相似问题 识别评估方法, 其特 征在于, 包括: 从数据集中提取多个语义关系情况下, 相匹配的语义相关的问题数据, 每一相匹配的 语义相关的问题数据均为文本数据, 包含验证问题对Qu与Qa, 以及问题Qa对应的不同匹配关 系下的多个 语义相关的问题集 合T; 构建基于关系感知神经网络相似问题识别模型, 对每一相匹配的语义相关的问题数据 进行联合表征, 并利用获得的问题Qa的关系感知表示向量与问题Qu的表示向量进行识别评 估, 训练阶段, 利用识别评估结果与识别标签构建损失函数, 更新模型参数; 测试阶段, 对于给定的问题对, 利用训练后的基于关系感知神经网络相似问题识别模 型进行识别评估。 2.根据权利要求1所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述从 数据集中提取多个 语义关系情况 下, 相匹配的语义相关的问题数据包括: 从收集到的数据中提取具有 匹配相关的问题, 每一问题都与其他多个问题构 成相似问 题匹配的关系, 所述相似问题匹配的关系包含两种类别, 第一种分类标签为1, 表示两个 问 题具有相同的语义, 属于语义匹配关系; 第二种分类标签为0, 表示两个 问题具有相同的关 键词, 但语义 不同, 属于语义相似关系; 将提取出的问题划分为两部分: 第一部分作为匹配问题知识库; 另一部分作为验证模 型的训练数据; 提取训练数据中的问题Qu与匹配问题知识库中的单个问题Qa构成一个验证 问题对, 对于问题Qa, 如果匹配问题知识库中的其他任意问题与Qa的分类标签为1, 则将放入 集合Tp, 如果分类标签为0, 则放入集合Tq; 集合T={Tp,Tq}即为问题Qa对应的不同匹配关系 下的多个 语义相关的问题集 合; 之后, 对每一相匹配的语义相关的问题数据进行分词, 获得验证问题对Qu与Qa的文本内 容分词结果以及问题集 合T中各问题的文本内容分词结果。 3.根据权利要求1所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述基 于关系感知神经网络相似问题识别模型包括: 问题表示层、 关系感知表示层和问题识别评 估层; 其中: 所述问题表示层, 用于提取每一验证问题对Qu与Qa的表示向量, 以及问题Qa对应的不同 匹配关系下的多个 语义相关的问题集 合中每一问题的表示向量; 所述关系感知表示层, 用于结合 问题Qa与问题集合T中每一 问题的语义关系, 获得问题 Qa的关系感知表示向量; 所述问题识别评估层, 用于利用问题Qu与问题Qa的表示向量, 以及问题Qa的关系感知表 示向量, 对 验证问题对Qu与Qa的语义关系进行识别评估。 4.根据权利要求3所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述问 题表示层, 对每 个问题进行独立编码, 生成问题的表示向量: h=Sentence ‑BERT(Q) 其中, h为问题Q的表示向量; Sentence ‑BERT表示Sentence  BERT模型; 对于验证问题对Qu与Qa通过问题表示层 获得相应的表示向量hu与ha; 对于问题集合T= {Tp,Tq}通过问题表示层获得语义匹配关系向量集Hp和语义相似关系的向量集Hq; 其中, 集 合Tp与Tq中的问题与Qa的分类标签 分别为1与0, 分类标签为1表 示两个问题属于语义匹配关 系, 分类标签为0表示两个问题属于语义相似关系。权 利 要 求 书 1/3 页 2 CN 114416947 A 25.根据权利要求3所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述结 合问题Qa与问题集合T中每 一问题的语 义关系, 提取出问题Qa的关系感知表示向量的步骤包 括: 使用RNs关系表示网络表征问题Qa与问题集 合T中每一问题的关系表示: 其中, gθ是多层感知机网络, 表示采用element ‑wise product方法进行运算 得到的ha与hk之间的交互特征, ha为问题Qa的表示向量, hk表示问题集合T中单个问题的表示 向量; hk∈Hpor Hq, Hp、 Hq分别为集合Tp、 Tq中问题的表示向量集合, 集合Tp中每一问题与问题 Qa的分类标签为1, 表示两个问题属 于语义匹配关系; 集合Tq中每一问题与问题Qa的分类标 签为0, 表示两个问题属于语义相似关系; 结合问题集 合T中每一问题的标签, 计算如下多标签下的匹配表示 函数: 其中, Nr为在第r个关系下多个语义匹配问题的语义向量集合; |Nr|表示语义 向量集合Nr中的向量数目, R表示标签的类别集 合; 基于表示向量 集合Hp与Hq将上述多标签下的匹配表示 函数展开, 得到: 其中, Wpi和Wqj分别是在两个关系下的学习权重, bpi和bqj是偏差参数; 各自为相应问题的表示向量; 采用element ‑wise product方法进行运算, 分别得到的ha与 之间、 ha与 之间的交互 特征: 得到: 其中, vr为问题Qa的关系感知表示向量。 6.根据权利要求3所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述利 用问题Qu与问题Qa的表示向量, 以及问题Qa的关系感知表示向量, 对验证问题对Qu与Qa的语 义关系进行识别评估 包括: 将问题Qu与问题Qa的表示向量, 以及问题Qa的关系感知表示向量连接, 表示 为: 其中, hu、 ha、 vr依次表示问题Qu的表示向量、 问题Qa的表示向量、 问题Qa的关系感知表示 向量; 通过RELU激活函数和sigmoid函数的运算获得验证问题对Qu与Qa的语义关系R(Qu,Qa),权 利 要 求 书 2/3 页 3 CN 114416947 A 3

PDF文档 专利 关系感知相似问题识别评估方法、系统、设备及存储介质

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 关系感知相似问题识别评估方法、系统、设备及存储介质 第 1 页 专利 关系感知相似问题识别评估方法、系统、设备及存储介质 第 2 页 专利 关系感知相似问题识别评估方法、系统、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。