standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210133838.2 (22)申请日 2022.02.14 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 吴欢 张珂欣 郑安妮 林慕云 (74)专利代理 机构 北京三友知识产权代理有限 公司 11127 专利代理师 周永君 汤在彦 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G10L 15/08(2006.01) G10L 15/26(2006.01) G10L 25/24(2013.01)H04M 3/51(2006.01) H04M 3/493(2006.01) (54)发明名称 一种话语提取方法及装置 (57)摘要 本申请提供一种话语提取方法及装置, 涉及 人工智能领域, 也可用于金融领域, 包括: 对预先 获取的语音流片段进行语音识别, 得到对应的对 话文本; 对各所述对话文本进行语义特征提取, 得到各所述对话文本的语义特征向量矩阵; 根据 各所述语义特征向量矩 阵对所述对话文本进行 聚类, 得到话语列表。 本申请能够对语音流片段 进行话语分析得到优秀 话语。 权利要求书2页 说明书14页 附图7页 CN 114461805 A 2022.05.10 CN 114461805 A 1.一种话语提取 方法, 其特 征在于, 包括: 对预先获取的语音流片段进行语音识别, 得到对应的对话文本; 对各所述对话文本进行语义特 征提取, 得到各 所述对话文本的语义特 征向量矩阵; 根据各所述语义特 征向量矩阵对所述对话文本进行聚类, 得到话语列表。 2.根据权利要求1所述的话语提取方法, 其特征在于, 所述对预先获取的语音流片段进 行语音识别, 得到对应的对话文本, 包括: 对所述语音流片段进行语音特 征提取, 得到所述语音流片段的语音特 征向量; 将所述语音特 征向量输入声学语音模型进行语音识别, 得到所述对话文本 。 3.根据权利要求2所述的话语提取方法, 其特征在于, 所述对所述语音流片段进行语音 特征提取, 得到所述语音流片段的语音特 征向量, 包括: 确定所述语音流片段的声谱图; 对所述声谱图进行倒谱分析, 得到所述语音特 征向量。 4.根据权利要求2所述的话语提取方法, 其特征在于, 所述声学语音模型包括: 声学模 型及语音模型; 所述将所述语音特征向量输入声学语音模型进行语音识别, 得到所述对话 文本, 包括: 将所述语音特 征向量输入所述声学模型, 得到所述语音特 征向量所对应的各 单字; 将所述各 单字输入所述语音模型, 以对所述各 单字进行修 正, 得到所述对话文本 。 5.根据权利要求1所述的话语提取方法, 其特征在于, 所述对各所述对话文本进行语义 特征提取, 得到各 所述对话文本的语义特 征向量矩阵, 包括: 筛选各所述对话文本, 得到各 所述对话文本对应的有效对话文本; 将各所述有效对话文本输入BERT模型, 以对各所述有效对话文本进行语义特征提取, 得到各所述对话文本的所述语义特 征向量矩阵。 6.根据权利要求1所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 计算所述语义特 征向量矩阵到各 预设聚类中心的距离; 将所述语义特征向量矩阵纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚 类中心; 根据更新后的聚类中心生成所述 话语列表。 7.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 提取各所述语义特 征向量矩阵的首 行向量; 计算所述首 行向量到各 预设聚类中心的距离; 将所述首 行向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中心; 根据更新后的聚类中心生成所述 话语列表。 8.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 确定所述语义特 征向量矩阵的各 行向量的第一均值向量; 计算所述第一均值向量到各 预设聚类中心的距离; 将所述第一均值向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中权 利 要 求 书 1/2 页 2 CN 114461805 A 2心; 根据更新后的聚类中心生成所述 话语列表。 9.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 对所述语义特 征向量矩阵设置会话轮数列向量; 确定含所述会话轮数列向量的语义特 征向量矩阵的第二均值向量; 计算所述第二均值向量到各 预设聚类中心的距离; 将所述第二均值向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中 心; 根据更新后的聚类中心生成所述 话语列表。 10.一种话语提取装置, 其特 征在于, 包括: 对话文本生成单元, 用于对预先获取的语音流片段进行语音识别, 得到对应的对话文 本; 语义向量提取单元, 用于对各所述对话文本进行语义特征提取, 得到各所述对话文本 的语义特 征向量矩阵; 话语列表生成单元, 用于根据各所述语义特征向量矩阵对所述对话文本进行聚类, 得 到话语列表。 11.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1至9任一项所述的话语提 取方法的步骤。 12.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现权利要求1至9任一项所述的话语提取 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114461805 A 3
专利 一种话语提取方法及装置
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:35
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
安华金和 数据安全治理白皮书5.0 行业数据安全治理实践集.pdf
ISO 20653 2023 Road vehicles — Degrees of protection (IP code) — Protection of elect.pdf
CH-T 3005-2021 低空数字航空摄影规范.pdf
GB-T 34575-2017 电力机车辅助变流器.pdf
GB-T 42508-2023 投资项目风险评估指南.pdf
中国信创产业研究报告.pdf
T-CSAE 111—2019 乘用车空气动力学性能术语.pdf
GB-T 39837-2021 信息技术 远程运维 技术参考模型.pdf
T-CCGA 40009—2021 车载液氢系统安全技术规范.pdf
DB52-T 1540.2-2021 政务数据 第2部分:元数据管理规范 贵州省.pdf
GB-Z 30286-2013 信息安全技术 信息系统保护轮廓和信息系统安全目标产生指南.pdf
安全架构实践的公理 2020.pdf
GB-T 41387-2022 信息安全技术 智能家居通用安全规范.pdf
京东 何永成 京东模块化运维体系建设.pdf
T-CI 146—2022 智慧教室 基于云网边端协同的 教学评价体系技术指南.pdf
GB-T 42447-2023 信息安全技术 电信领域数据安全指南.pdf
GB-T 42461-2023 信息安全技术 网络安全服务成本度量指南.pdf
ISO IEC 19770-11 2021 Information technology — IT asset management — Part 11 Requirements for bodies providing audit and certification of IT asset management systems.pdf
T-WAPIA 045.1—2021 信息技术 系统间远程通信和信息交换 原子密钥建立与实体鉴别 第1部分:服务和协议.pdf
GB-T 6952-2015 卫生陶瓷.pdf
1
/
24
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。