standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210133838.2 (22)申请日 2022.02.14 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 吴欢 张珂欣 郑安妮 林慕云  (74)专利代理 机构 北京三友知识产权代理有限 公司 11127 专利代理师 周永君 汤在彦 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G10L 15/08(2006.01) G10L 15/26(2006.01) G10L 25/24(2013.01)H04M 3/51(2006.01) H04M 3/493(2006.01) (54)发明名称 一种话语提取方法及装置 (57)摘要 本申请提供一种话语提取方法及装置, 涉及 人工智能领域, 也可用于金融领域, 包括: 对预先 获取的语音流片段进行语音识别, 得到对应的对 话文本; 对各所述对话文本进行语义特征提取, 得到各所述对话文本的语义特征向量矩阵; 根据 各所述语义特征向量矩 阵对所述对话文本进行 聚类, 得到话语列表。 本申请能够对语音流片段 进行话语分析得到优秀 话语。 权利要求书2页 说明书14页 附图7页 CN 114461805 A 2022.05.10 CN 114461805 A 1.一种话语提取 方法, 其特 征在于, 包括: 对预先获取的语音流片段进行语音识别, 得到对应的对话文本; 对各所述对话文本进行语义特 征提取, 得到各 所述对话文本的语义特 征向量矩阵; 根据各所述语义特 征向量矩阵对所述对话文本进行聚类, 得到话语列表。 2.根据权利要求1所述的话语提取方法, 其特征在于, 所述对预先获取的语音流片段进 行语音识别, 得到对应的对话文本, 包括: 对所述语音流片段进行语音特 征提取, 得到所述语音流片段的语音特 征向量; 将所述语音特 征向量输入声学语音模型进行语音识别, 得到所述对话文本 。 3.根据权利要求2所述的话语提取方法, 其特征在于, 所述对所述语音流片段进行语音 特征提取, 得到所述语音流片段的语音特 征向量, 包括: 确定所述语音流片段的声谱图; 对所述声谱图进行倒谱分析, 得到所述语音特 征向量。 4.根据权利要求2所述的话语提取方法, 其特征在于, 所述声学语音模型包括: 声学模 型及语音模型; 所述将所述语音特征向量输入声学语音模型进行语音识别, 得到所述对话 文本, 包括: 将所述语音特 征向量输入所述声学模型, 得到所述语音特 征向量所对应的各 单字; 将所述各 单字输入所述语音模型, 以对所述各 单字进行修 正, 得到所述对话文本 。 5.根据权利要求1所述的话语提取方法, 其特征在于, 所述对各所述对话文本进行语义 特征提取, 得到各 所述对话文本的语义特 征向量矩阵, 包括: 筛选各所述对话文本, 得到各 所述对话文本对应的有效对话文本; 将各所述有效对话文本输入BERT模型, 以对各所述有效对话文本进行语义特征提取, 得到各所述对话文本的所述语义特 征向量矩阵。 6.根据权利要求1所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 计算所述语义特 征向量矩阵到各 预设聚类中心的距离; 将所述语义特征向量矩阵纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚 类中心; 根据更新后的聚类中心生成所述 话语列表。 7.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 提取各所述语义特 征向量矩阵的首 行向量; 计算所述首 行向量到各 预设聚类中心的距离; 将所述首 行向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中心; 根据更新后的聚类中心生成所述 话语列表。 8.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 确定所述语义特 征向量矩阵的各 行向量的第一均值向量; 计算所述第一均值向量到各 预设聚类中心的距离; 将所述第一均值向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中权 利 要 求 书 1/2 页 2 CN 114461805 A 2心; 根据更新后的聚类中心生成所述 话语列表。 9.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 对所述语义特 征向量矩阵设置会话轮数列向量; 确定含所述会话轮数列向量的语义特 征向量矩阵的第二均值向量; 计算所述第二均值向量到各 预设聚类中心的距离; 将所述第二均值向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中 心; 根据更新后的聚类中心生成所述 话语列表。 10.一种话语提取装置, 其特 征在于, 包括: 对话文本生成单元, 用于对预先获取的语音流片段进行语音识别, 得到对应的对话文 本; 语义向量提取单元, 用于对各所述对话文本进行语义特征提取, 得到各所述对话文本 的语义特 征向量矩阵; 话语列表生成单元, 用于根据各所述语义特征向量矩阵对所述对话文本进行聚类, 得 到话语列表。 11.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1至9任一项所述的话语提 取方法的步骤。 12.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现权利要求1至9任一项所述的话语提取 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114461805 A 3

PDF文档 专利 一种话语提取方法及装置

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种话语提取方法及装置 第 1 页 专利 一种话语提取方法及装置 第 2 页 专利 一种话语提取方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:35上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。