(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210047822.X
(22)申请日 2022.01.17
(71)申请人 中国科学技术大学
地址 230026 安徽省合肥市包河区金寨路
96号
(72)发明人 陈恩红 刘淇 陈彦敏 王皓
黄振亚
(74)专利代理 机构 北京凯特来知识产权代理有
限公司 1 1260
代理人 郑立明 韩珂
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
G06F 16/35(2019.01)G06Q 30/02(2012.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
关系感知相似问题识别评估方法、 系统、 设
备及存储介质
(57)摘要
本发明公开了一种关系感知相似问题识别
评估方法、 系统、 设备及存储介质, 相关方案使用
基于关系感知神经网络相似问题识别模型来进
行问题对的相似问题识别, 相比于传统模型, 使
用了多个语义匹配的语义关系相关信息。 对于预
测的结果, 在多个 评价指标上有一定的提高。
权利要求书3页 说明书8页 附图2页
CN 114416947 A
2022.04.29
CN 114416947 A
1.一种关系感知的相似问题 识别评估方法, 其特 征在于, 包括:
从数据集中提取多个语义关系情况下, 相匹配的语义相关的问题数据, 每一相匹配的
语义相关的问题数据均为文本数据, 包含验证问题对Qu与Qa, 以及问题Qa对应的不同匹配关
系下的多个 语义相关的问题集 合T;
构建基于关系感知神经网络相似问题识别模型, 对每一相匹配的语义相关的问题数据
进行联合表征, 并利用获得的问题Qa的关系感知表示向量与问题Qu的表示向量进行识别评
估, 训练阶段, 利用识别评估结果与识别标签构建损失函数, 更新模型参数;
测试阶段, 对于给定的问题对, 利用训练后的基于关系感知神经网络相似问题识别模
型进行识别评估。
2.根据权利要求1所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述从
数据集中提取多个 语义关系情况 下, 相匹配的语义相关的问题数据包括:
从收集到的数据中提取具有 匹配相关的问题, 每一问题都与其他多个问题构 成相似问
题匹配的关系, 所述相似问题匹配的关系包含两种类别, 第一种分类标签为1, 表示两个 问
题具有相同的语义, 属于语义匹配关系; 第二种分类标签为0, 表示两个 问题具有相同的关
键词, 但语义 不同, 属于语义相似关系;
将提取出的问题划分为两部分: 第一部分作为匹配问题知识库; 另一部分作为验证模
型的训练数据; 提取训练数据中的问题Qu与匹配问题知识库中的单个问题Qa构成一个验证
问题对, 对于问题Qa, 如果匹配问题知识库中的其他任意问题与Qa的分类标签为1, 则将放入
集合Tp, 如果分类标签为0, 则放入集合Tq; 集合T={Tp,Tq}即为问题Qa对应的不同匹配关系
下的多个 语义相关的问题集 合;
之后, 对每一相匹配的语义相关的问题数据进行分词, 获得验证问题对Qu与Qa的文本内
容分词结果以及问题集 合T中各问题的文本内容分词结果。
3.根据权利要求1所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述基
于关系感知神经网络相似问题识别模型包括: 问题表示层、 关系感知表示层和问题识别评
估层; 其中:
所述问题表示层, 用于提取每一验证问题对Qu与Qa的表示向量, 以及问题Qa对应的不同
匹配关系下的多个 语义相关的问题集 合中每一问题的表示向量;
所述关系感知表示层, 用于结合 问题Qa与问题集合T中每一 问题的语义关系, 获得问题
Qa的关系感知表示向量;
所述问题识别评估层, 用于利用问题Qu与问题Qa的表示向量, 以及问题Qa的关系感知表
示向量, 对 验证问题对Qu与Qa的语义关系进行识别评估。
4.根据权利要求3所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述问
题表示层, 对每 个问题进行独立编码, 生成问题的表示向量:
h=Sentence ‑BERT(Q)
其中, h为问题Q的表示向量; Sentence ‑BERT表示Sentence BERT模型;
对于验证问题对Qu与Qa通过问题表示层 获得相应的表示向量hu与ha; 对于问题集合T=
{Tp,Tq}通过问题表示层获得语义匹配关系向量集Hp和语义相似关系的向量集Hq; 其中, 集
合Tp与Tq中的问题与Qa的分类标签 分别为1与0, 分类标签为1表 示两个问题属于语义匹配关
系, 分类标签为0表示两个问题属于语义相似关系。权 利 要 求 书 1/3 页
2
CN 114416947 A
25.根据权利要求3所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述结
合问题Qa与问题集合T中每 一问题的语 义关系, 提取出问题Qa的关系感知表示向量的步骤包
括:
使用RNs关系表示网络表征问题Qa与问题集 合T中每一问题的关系表示:
其中, gθ是多层感知机网络,
表示采用element ‑wise product方法进行运算
得到的ha与hk之间的交互特征, ha为问题Qa的表示向量, hk表示问题集合T中单个问题的表示
向量; hk∈Hpor Hq, Hp、 Hq分别为集合Tp、 Tq中问题的表示向量集合, 集合Tp中每一问题与问题
Qa的分类标签为1, 表示两个问题属 于语义匹配关系; 集合Tq中每一问题与问题Qa的分类标
签为0, 表示两个问题属于语义相似关系;
结合问题集 合T中每一问题的标签, 计算如下多标签下的匹配表示 函数:
其中,
Nr为在第r个关系下多个语义匹配问题的语义向量集合; |Nr|表示语义
向量集合Nr中的向量数目, R表示标签的类别集 合;
基于表示向量 集合Hp与Hq将上述多标签下的匹配表示 函数展开, 得到:
其中, Wpi和Wqj分别是在两个关系下的学习权重, bpi和bqj是偏差参数;
各自为相应问题的表示向量;
采用element ‑wise product方法进行运算, 分别得到的ha与
之间、 ha与
之间的交互
特征:
得到:
其中, vr为问题Qa的关系感知表示向量。
6.根据权利要求3所述的一种关系感知的相似问题识别评估方法, 其特征在于, 所述利
用问题Qu与问题Qa的表示向量, 以及问题Qa的关系感知表示向量, 对验证问题对Qu与Qa的语
义关系进行识别评估 包括:
将问题Qu与问题Qa的表示向量, 以及问题Qa的关系感知表示向量连接, 表示 为:
其中, hu、 ha、 vr依次表示问题Qu的表示向量、 问题Qa的表示向量、 问题Qa的关系感知表示
向量;
通过RELU激活函数和sigmoid函数的运算获得验证问题对Qu与Qa的语义关系R(Qu,Qa),权 利 要 求 书 2/3 页
3
CN 114416947 A
3
专利 关系感知相似问题识别评估方法、系统、设备及存储介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:53上传分享