(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211071561.1 (22)申请日 2022.09.02 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 杨韬  (74)专利代理 机构 深圳市深佳知识产权代理事 务所(普通 合伙) 44285 专利代理师 聂秀娜 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/284(2020.01) G06F 40/295(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种多文档阅读理解方法、 装置、 设备及存 储介质 (57)摘要 本申请实施例提供了一种多文档阅读理解 方法、 装置、 设备及存储介质, 用于获取抽取出相 同答案的答复文档之间的语义特征, 从而增加答 案重排序模 型中的排序效果, 提升多文档阅读理 解的准确性。 包括: 获取目标问题、 目标问题对应 的多个答复文档并建立答案抽取模型和答案重 排序模型; 调用答案抽取模型获取多个答复文档 对目标问题的预测答案集; 将预测答案集按照相 同预测答案进行分类得到至少一个答案集; 调用 答案重排序模型获取至少一个答案集对应的至 少一个答案表征集合; 调用答案重排序模型获取 答案表征集合对应的预测答案的预测分数; 根据 预测分数输出目标问题对应的最终答案。 本申请 可应用于人工智能领域。 权利要求书3页 说明书17页 附图8页 CN 115455160 A 2022.12.09 CN 115455160 A 1.一种多 文档阅读理解方法, 其特 征在于, 包括: 获取目标问题、 所述目标问题对应的多个答复文档, 并建立答案抽取模型和答案重排 序模型; 调用所述 答案抽取模型获取 所述多个答复文档对所述目标问题的预测答案集; 将所述预测答案集按照相同预测答案进行分类得到 至少一个答案集; 调用所述答案重排序模型获取所述至少一个答案集对应的至少一个答案表征集合, 所 述至少一个答案集中每个答案集对应一个预测答案, 所述至少一个答案表征集合中的答案 表征为所述预测答案的表征向量; 调用所述 答案重排序模型获取 所述答案表征集 合对应的预测答案的预测分数; 根据所述预测分数输出 所述目标问题对应的最终答案 。 2.根据权利要求1所述的方法, 其特征在于, 所述调用所述答案重排序模型获取所述至 少一个答案集对应的至少一个答案表征集 合包括: 调用所述答案重排序模型获取所述目标问题与第一答复文档集中各个答复文档的第 一输出向量集合, 所述第一答复文档集包括所述至少一个答案集中第一答案集对应的答复 文档; 从所述第一输出向量集合中选择所述第一答复文档集对应的预测答案的字符串进行 池化得到所述第一 答案集中各个预测答案的中间答案表征集 合; 对所述中间答案表征集合进行自注意力处理得到所述第一答案集对应的预测答案的 第一答案表征; 依此类推, 遍历得到所述至少一个答案集中各个答案集对应的预测答案的答案表征, 并归类为所述至少一个答案表征集合, 所述第一答案表征包含于所述至少一个答案表征集 合。 3.根据权利要求2所述的方法, 其特征在于, 所述调用所述答案重排序模型获取所述目 标问题与第一 答复文档集中各个答复文档的第一输出向量 集合包括: 将所述目标问题的每个字符与所述第 一答复文档集合中每个答复文档的每个字符, 利 用开始字符与间隔字符进行拼接得到第一词序列集 合; 将所述第一词序列集 合输入所述 答案重排序模型 得到所述第一输出向量 集合。 4.根据权利要求2所述的方法, 其特征在于, 所述对所述中间答案表征集合进行自注意 力处理得到所述第一 答案集对应的预测答案的第一 答案表征包括: 对所述中间答案表征集合中的每个中间答案表征进行自注意力处理得到自注意预测 分数集合; 对所述自注意预测分数集 合中进行归一 化处理得到归一 化预测分数集 合; 对所述归一化预测分数集合中的各个归一化预测分数进行加权求和得到所述第一答 案表征。 5.根据权利要求1至4中任一项所述的方法, 其特 征在于, 所述方法还 包括: 获取训练样本集、 并建立初始答案抽取模型和初始答案重排序模型, 所述训练样本集 包括问题样本集、 所述问题样本集对应的答复文档样本集; 利用所述训练样本集训练所述初始答案抽取模型和所述初始答案重排序模型得到所 述答案抽取模型和所述 答案重排序模型。权 利 要 求 书 1/3 页 2 CN 115455160 A 26.根据权利要求5所述的方法, 其特征在于, 所述初始答案抽取模型和所述初始答案重 排序模型共享相同的编 码层, 所述利用所述训练样本集训练所述初始答案抽取模型和所述 初始答案 重排序模型 得到所述 答案抽取模型和所述 答案重排序模型包括: 调用所述编码层获取 所述训练样本集对应的第二输出向量; 将所述第二输出向量输入所述初始答案抽取模型 得到第一损失值和训练答案集; 将所述训练答案集输入所述初始答案 重排序模型 得到第二损失值; 利用所述第一损失值和所述第二损失值之和反向调整所述初始答案抽取模型和所述 初始答案 重排序模型的权 重参数得到所述 答案抽取模型和所述 答案重排序模型。 7.根据权利要求6所述的方法, 其特征在于, 所述将所述输出向量输入所述初始答案抽 取模型得到第一损失值和训练答案集包括: 将所述输出向量输入所述初始答案抽取模型 得到所述训练答案集; 获取所述输出向量的训练答案集中每个训练答案对应的开始词的预测分数和结束词 的预测分数; 利用激活函数将所述开始词的预测分数转化为第 一概率值, 并利用所述激活函数将所 述结束词的预测分数转 化为第二概率值; 根据所述第一 概率值和所述第二 概率值得到所述第一损失值; 所述将所述训练答案集输入所述初始答案 重排序模型 得到第二损失值包括: 将所述训练答案集输入所述初始答案重排序模型得到训练答案集对应的训练答案表 征集合; 获取所述训练答案表征集 合中各个训练答案对应的训练预测分数集 合; 利用激活函数将所述训练预测分数集 合中的各个训练预测分数转 化为第三概率值; 利用交叉熵和所述第三 概率值得到所述第二损失值。 8.一种多 文档阅读理解模型, 其特 征在于, 包括: 获取模块, 用于获取目标问题、 所述目标问题对应的多个答复文档、 答案抽取模型和答 案重排序模型; 处理模块, 用于调用所述答案抽取模型获取所述多个答复文档对所述目标问题的预测 答案集; 将所述预测 答案集按照相同预测答案进行分类得到至少一个答案集; 调用所述答 案重排序模型获取所述至少一个答案集对应的至少一个答案表征集合, 所述至少一个答案 集中每个答案集对应一个预测答案, 所述至少一个答案表征集合中的答案表征为所述预测 答案的表征向量; 调用所述答案重排序模型获取所述答案表征集合对应的预测答案的预测 分数; 输出模块, 用于根据所述预测分数输出 所述目标问题对应的最终答案 。 9.一种计算机设备, 其特 征在于, 包括: 存 储器、 处理器以及总线系统; 其中, 所述存 储器用于存 储程序; 所述处理器用于执行所述存储器中的程序, 所述处理器用于根据程序代码中的指令执 行权利要求1至7中任一项所述的方法; 所述总线系统用于连接所述存储器以及所述处理器, 以使所述存储器以及所述处理器 进行通信。 10.一种计算机可读存储介质, 包括指令, 当其在计算机上运行时, 使得计算机执行如权 利 要 求 书 2/3 页 3 CN 115455160 A 3

.PDF文档 专利 一种多文档阅读理解方法、装置、设备及存储介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多文档阅读理解方法、装置、设备及存储介质 第 1 页 专利 一种多文档阅读理解方法、装置、设备及存储介质 第 2 页 专利 一种多文档阅读理解方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:11:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。