(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210056342.X
(22)申请日 2022.01.18
(71)申请人 中国平安人寿保险股份有限公司
地址 518000 广东省深圳市福田街道益田
路5033号平安金融中心14、 15、 16、 37、
41、 44、 45、 46、 54、 58、 59层
(72)发明人 罗霄
(74)专利代理 机构 深圳市沃德知识产权代理事
务所(普通 合伙) 44347
代理人 高杰 于志光
(51)Int.Cl.
G06F 40/30(2020.01)
G06F 40/205(2020.01)
G06F 40/284(2020.01)
G06F 16/35(2019.01)G06N 3/04(2006.01)
G10L 15/26(2006.01)
G10L 15/02(2006.01)
G10L 25/24(2013.01)
G10L 15/14(2006.01)
G10L 15/16(2006.01)
(54)发明名称
语音智能匹配方法、 装置、 电子设备及存储
介质
(57)摘要
本发明涉及人工智能领域, 揭露一种语音智
能匹配方法, 包括: 对至少两段通话语音进行语
音识别, 得到至少两段语音文本; 利用文本匹配
模型中编码层对每段语音文本中的文本语句进
行双向编码, 得到每段语音文本的双向句向量,
根据每段语音文本的双向句向量, 利用编码层编
码每段语音文本的文本隐向量; 根据双向句向量
和文本隐向量, 利用文本匹配模 型中交互层计算
语音文本之间的信息关联性, 以识别语音文本中
的关联信息特征; 利用文本匹配模 型中池化层对
关联信息特征进行池化处理, 得到目标信息特
征; 根据目标信息特征, 利用文本匹配模型中全
连接层计算语音文本之间的匹配类别, 以识别至
少两段通话语音的匹配结果。 本发 明可以提高语
音匹配的准确性。
权利要求书3页 说明书10页 附图3页
CN 114429137 A
2022.05.03
CN 114429137 A
1.一种语音智能匹配方法, 其特 征在于, 所述方法包括:
获取至少两段通 话语音, 对每段 所述通话语音进行语音识别, 得到 至少两段语音 文本;
利用预训练好的文本匹配模型中的编码层对每段所述语音文本中的文本语句进行双
向编码, 得到每段所述语音文本的双向句向量, 根据每段所述语音文本的双向句向量, 利用
所述编码层编码每段 所述语音 文本的文本隐向量;
根据所述双向句向量和所述文本隐向量, 利用所述文本匹配模型中的交互层计算所述
语音文本之间的信息关联性, 以识别所述语音 文本中的关联信息特 征;
利用所述文本匹配模型中的池化层对所述关联信 息特征进行池化处理, 得到目标信 息
特征;
根据所述目标信 息特征, 利用所述文本匹配模型中的全连接层计算所述语音文本之间
的匹配类别, 根据所述匹配 类别, 识别所述至少两段通 话语音的匹配结果。
2.如权利要求1所述的语音智能匹配方法, 其特征在于, 所述对每段所述通话语音进行
语音识别, 得到 至少两段语音 文本, 包括:
提取每段所述通话语音的音频特征, 利用声学模型计算每段所述音频特征的音素序列
概率;
根据所述音素序列概率, 利用语言模型计算每段所述音频特征的文字序列, 根据每段
所述通话语音的文字序列, 得到 至少两段语音 文本。
3.如权利要求1所述的语音智能匹配方法, 其特征在于, 所述利用预训练好的文本匹配
模型中的编 码层对每段所述语音文本中文本语句进行双向编码, 得到每段所述语音文本的
双向句向量, 包括:
获取每段所述语音文本 中文本语句的文本词语, 对所述文本词语进行前向向量编码及
后向向量编码, 得到前向词向量和后向词向量;
将所述前向词向量和后向词向量进行组合, 得到每段 所述语音 文本的双向句向量。
4.如权利要求1所述的语音智能匹配方法, 其特征在于, 所述根据 所述双向句向量和所
述文本隐向量, 利用所述文本匹配模型中的交互层检测所述语音文本之间的关联信息特
征, 包括:
计算所述双向句向量之间的语句相似度矩阵和所述文本隐向量之间的文本相似度矩
阵;
根据所述语句相似度矩阵, 计算所述双 向句向量之间的语句关联性, 根据所述文本相
似度矩阵, 计算所述文本隐向量之间的文本关联性;
根据所述语句关联性和所述文本关联性, 识别所述语音 文本之间的关联信息特 征。
5.如权利要求4所述的语音智能匹配方法, 其特征在于, 所述根据所述语句相似度矩
阵, 计算所述双向句向量之间的语句关联性, 包括:
利用下述公式计算所述双向句向量之间的语句关联性:
权 利 要 求 书 1/3 页
2
CN 114429137 A
2其中,
表示语音文本a中第i个双向句向量与语音文本b中第j个双向句向量的语句关
联性,
表示语音文本b中第j个双向句向量,
表示语音文本b中第j个双向句向量与语音文
本a中第i个双向句向量的语句关联性,
表示语音文本a中第i个双向句向量, eij表示语句
相似度矩阵, exp(eij)表示语句相似度矩阵的指数函数, lb表示语音文本b中双向句向量的
数量, la表示语音 文本a中双向句向量的数量。
6.如权利要求1所述的语音智能匹配方法, 其特征在于, 所述根据 所述语句关联性和所
述文本关联性, 识别所述语音 文本之间的关联信息特 征, 包括:
根据所述语句关联性, 确定所述语音文本之间的关联语句特征, 根据 所述文本关联性,
确定所述语音 文本之间的关联主题特 征;
根据所述关联语句特征和所述关联主题特征, 生成所述语音文本之间的关联信息特
征。
7.如权利要求1至6中任意一项所述的语音智能匹配方法, 其特征在于, 所述利用所述
文本匹配模型中池化层对所述关联信息特 征进行池化处 理, 得到目标信息特 征, 包括:
利用所述池化层中的池化算法对所述关联信 息特征进行特征降维, 并利用所述池化层
中的激活函数激活特 征降维后的所述关联信息特 征, 得到所述目标信息特 征。
8.一种语音智能匹配装置, 其特 征在于, 所述装置包括:
通话语音识别模块, 用于获取至少两段通话语音, 对每段所述通话语音进行语音识别,
得到至少两段语音 文本;
语音文本编码模块, 用于利用预训练好的文本匹配模型中的编码层对每段所述语音文
本中的文本语句进行双向编码, 得到每段所述语音文本的双向句向量, 根据每段所述语音
文本的双向句向量, 利用所述编码层编码每段 所述语音 文本的文本隐向量;
信息特征提取模块, 用于根据所述双 向句向量和所述文本隐向量, 利用所述文本匹配
模型中的交互层计算所述语音文本之 间的信息 关联性, 以识别所述语音文本中的关联信息
特征;
信息特征池化模块, 用于利用所述文本匹配模型中的池化层对所述关联信 息特征进行
池化处理, 得到目标信息特 征;
匹配结果识别模块, 用于根据所述目标信息特征, 利用所述文本匹配模型中的全连接
层计算所述语音文本之间的匹配类别, 根据所述匹配类别, 识别所述至少 两段通话语音的
匹配结果。
9.一种电子设备, 其特 征在于, 所述电子设备包括:
至少一个处 理器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所
述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任意一项 所
述的语音智能匹配方法。
10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处权 利 要 求 书 2/3 页
3
CN 114429137 A
3
专利 语音智能匹配方法、装置、电子设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:52上传分享