专利一种多文档阅读理解方法、装置、设备及存储介质 -在线下载 -AI解读-standardlibrary.site

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211071561.1 (22)申请日 2022.09.02 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人杨韬　 (74)专利代理机构深圳市深佳知识产权代理事务所(普通合伙) 44285 专利代理师聂秀娜 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/284(2020.01) G06F 40/295(2020.01) G06K 9/62(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种多文档阅读理解方法、装置、设备及存储介质 (57)摘要本申请实施例提供了一种多文档阅读理解方法、装置、设备及存储介质，用于获取抽取出相同答案的答复文档之间的语义特征，从而增加答案重排序模型中的排序效果，提升多文档阅读理解的准确性。包括：获取目标问题、目标问题对应的多个答复文档并建立答案抽取模型和答案重排序模型；调用答案抽取模型获取多个答复文档对目标问题的预测答案集；将预测答案集按照相同预测答案进行分类得到至少一个答案集；调用答案重排序模型获取至少一个答案集对应的至少一个答案表征集合；调用答案重排序模型获取答案表征集合对应的预测答案的预测分数；根据预测分数输出目标问题对应的最终答案。本申请可应用于人工智能领域。权利要求书3页说明书17页附图8页 CN 115455160 A 2022.12.09 CN 115455160 A 1.一种多文档阅读理解方法，其特征在于，包括：获取目标问题、所述目标问题对应的多个答复文档，并建立答案抽取模型和答案重排序模型；调用所述答案抽取模型获取所述多个答复文档对所述目标问题的预测答案集；将所述预测答案集按照相同预测答案进行分类得到至少一个答案集；调用所述答案重排序模型获取所述至少一个答案集对应的至少一个答案表征集合，所述至少一个答案集中每个答案集对应一个预测答案，所述至少一个答案表征集合中的答案表征为所述预测答案的表征向量；调用所述答案重排序模型获取所述答案表征集合对应的预测答案的预测分数；根据所述预测分数输出所述目标问题对应的最终答案。 2.根据权利要求1所述的方法，其特征在于，所述调用所述答案重排序模型获取所述至少一个答案集对应的至少一个答案表征集合包括：调用所述答案重排序模型获取所述目标问题与第一答复文档集中各个答复文档的第一输出向量集合，所述第一答复文档集包括所述至少一个答案集中第一答案集对应的答复文档；从所述第一输出向量集合中选择所述第一答复文档集对应的预测答案的字符串进行池化得到所述第一答案集中各个预测答案的中间答案表征集合；对所述中间答案表征集合进行自注意力处理得到所述第一答案集对应的预测答案的第一答案表征；依此类推，遍历得到所述至少一个答案集中各个答案集对应的预测答案的答案表征，并归类为所述至少一个答案表征集合，所述第一答案表征包含于所述至少一个答案表征集合。 3.根据权利要求2所述的方法，其特征在于，所述调用所述答案重排序模型获取所述目标问题与第一答复文档集中各个答复文档的第一输出向量集合包括：将所述目标问题的每个字符与所述第一答复文档集合中每个答复文档的每个字符，利用开始字符与间隔字符进行拼接得到第一词序列集合；将所述第一词序列集合输入所述答案重排序模型得到所述第一输出向量集合。 4.根据权利要求2所述的方法，其特征在于，所述对所述中间答案表征集合进行自注意力处理得到所述第一答案集对应的预测答案的第一答案表征包括：对所述中间答案表征集合中的每个中间答案表征进行自注意力处理得到自注意预测分数集合；对所述自注意预测分数集合中进行归一化处理得到归一化预测分数集合；对所述归一化预测分数集合中的各个归一化预测分数进行加权求和得到所述第一答案表征。 5.根据权利要求1至4中任一项所述的方法，其特征在于，所述方法还包括：获取训练样本集、并建立初始答案抽取模型和初始答案重排序模型，所述训练样本集包括问题样本集、所述问题样本集对应的答复文档样本集；利用所述训练样本集训练所述初始答案抽取模型和所述初始答案重排序模型得到所述答案抽取模型和所述答案重排序模型。权　利　要　求　书 1/3 页 2 CN 115455160 A 26.根据权利要求5所述的方法，其特征在于，所述初始答案抽取模型和所述初始答案重排序模型共享相同的编码层，所述利用所述训练样本集训练所述初始答案抽取模型和所述初始答案重排序模型得到所述答案抽取模型和所述答案重排序模型包括：调用所述编码层获取所述训练样本集对应的第二输出向量；将所述第二输出向量输入所述初始答案抽取模型得到第一损失值和训练答案集；将所述训练答案集输入所述初始答案重排序模型得到第二损失值；利用所述第一损失值和所述第二损失值之和反向调整所述初始答案抽取模型和所述初始答案重排序模型的权重参数得到所述答案抽取模型和所述答案重排序模型。 7.根据权利要求6所述的方法，其特征在于，所述将所述输出向量输入所述初始答案抽取模型得到第一损失值和训练答案集包括：将所述输出向量输入所述初始答案抽取模型得到所述训练答案集；获取所述输出向量的训练答案集中每个训练答案对应的开始词的预测分数和结束词的预测分数；利用激活函数将所述开始词的预测分数转化为第一概率值，并利用所述激活函数将所述结束词的预测分数转化为第二概率值；根据所述第一概率值和所述第二概率值得到所述第一损失值；所述将所述训练答案集输入所述初始答案重排序模型得到第二损失值包括：将所述训练答案集输入所述初始答案重排序模型得到训练答案集对应的训练答案表征集合；获取所述训练答案表征集合中各个训练答案对应的训练预测分数集合；利用激活函数将所述训练预测分数集合中的各个训练预测分数转化为第三概率值；利用交叉熵和所述第三概率值得到所述第二损失值。 8.一种多文档阅读理解模型，其特征在于，包括：获取模块，用于获取目标问题、所述目标问题对应的多个答复文档、答案抽取模型和答案重排序模型；处理模块，用于调用所述答案抽取模型获取所述多个答复文档对所述目标问题的预测答案集；将所述预测答案集按照相同预测答案进行分类得到至少一个答案集；调用所述答案重排序模型获取所述至少一个答案集对应的至少一个答案表征集合，所述至少一个答案集中每个答案集对应一个预测答案，所述至少一个答案表征集合中的答案表征为所述预测答案的表征向量；调用所述答案重排序模型获取所述答案表征集合对应的预测答案的预测分数；输出模块，用于根据所述预测分数输出所述目标问题对应的最终答案。 9.一种计算机设备，其特征在于，包括：存储器、处理器以及总线系统；其中，所述存储器用于存储程序；所述处理器用于执行所述存储器中的程序，所述处理器用于根据程序代码中的指令执行权利要求1至7中任一项所述的方法；所述总线系统用于连接所述存储器以及所述处理器，以使所述存储器以及所述处理器进行通信。 10.一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权　利　要　求　书 2/3 页 3 CN 115455160 A 3

专利 一种多文档阅读理解方法、装置、设备及存储介质

专利一种多文档阅读理解方法、装置、设备及存储介质