(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211076170.9 (22)申请日 2022.09.05 (71)申请人 深圳市华 付信息技 术有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室(入驻深圳市 前海商务秘书 有限公司) (72)发明人 汤红 罗亮  (74)专利代理 机构 深圳中创智财知识产权代理 有限公司 4 4553 专利代理师 吴英 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 40/216(2020.01)G06F 40/284(2020.01) G06F 40/289(2020.01) G06F 40/35(2020.01) G10L 17/22(2013.01) (54)发明名称 人机交互方法、 装置、 设备及存 储介质 (57)摘要 本发明涉及人机交互技术领域, 公开了一种 人机交互方法、 装置、 设备及存储介质。 人机交互 方法包括: 获取语音信号, 并将所述语音信号转 换为文本序列; 对所述文本序列进行二分类预 测, 得到预测结果, 其中, 所述预测结果包括任务 型意图与问答型意图; 基于所述预测结果进行语 义提取, 得到语义提取结果; 若所述预测结果为 任务型意图, 则基于所述语义提取结果控制显示 屏幕显示相应的业务页面; 若所述预测结果为问 答型意图, 则基于所述语义提取结果控制显示屏 幕显示相应的问答结果。 本发明提供的人机交互 方法通过自然语 言问答识别用户意图, 并根据用 户意图向用户提供对应业务, 加快服务速度, 提 高人机交 互体验。 权利要求书2页 说明书15页 附图4页 CN 115146066 A 2022.10.04 CN 115146066 A 1.一种人机交 互方法, 其特 征在于, 所述人机交 互方法包括: 获取语音信号, 并将所述语音信号 转换为文本序列; 对所述文本序列进行二分类预测, 得到预测结果, 其中, 所述预测结果包括任务型意图 与问答型意图; 基于所述预测结果进行语义 提取, 得到语义 提取结果; 若所述预测结果为任务型意图, 则基于所述语义提取结果控制显示屏幕显示相应的业 务页面; 若所述预测结果为问答型意图, 则基于所述语义提取结果控制显示屏幕显示相应的问 答结果; 其中, 步骤 “对所述文本序列进行二分类预测, 得到预测结果 ”包括: 对所述文本序列进行词嵌入, 得到词向量; 提取所述文本序列单词级的N ‑Gram特征, 得到特 征向量; 基于所述词向量与所述特 征向量, 计算所述文本序列属于各 标签类别的概 率。 2.根据权利要求1所述的人机交互方法, 其特征在于, 所述获取语音信号, 并将所述语 音信号转换为文本序列包括: 获取语音信号, 并使用预置检测算法提取所述语音信号中的人声区间, 得到第一语音 信号; 获取分帧参数与窗函数, 并基于所述分帧参数与 所述窗函数对所述第 一语音信号进行 预处理, 得到第二语音信号; 对所述第二语音信号进行 特征提取, 得到语音特 征向量; 基于预训练的声学模型与语言模型, 将所述语音特 征向量转化为相应的文本序列。 3.根据权利要求1所述的人机交互方法, 其特征在于, 所述标签的类别包括任务型意图 与问答型意图, 所述预测结果即概 率较大的标签 类别。 4.根据权利要求1所述的人机交互方法, 其特征在于, 当所述预测结果是任务型意图 时, 所述基于所述预测结果进行语义 提取, 得到语义 提取结果包括: 对所述文本序列进行词嵌入, 得到第一词向量; 基于上下文信息对所述第一词向量进行训练, 得到第二词向量; 基于所述第二词向量, 应用条件随机场模型进行 预测, 得到词性标注序列。 5.根据权利要求1所述的人机交互方法, 其特征在于, 当所述预测结果是问答型意图 时, 所述基于所述预测结果进行语义 提取, 得到语义 提取结果包括: 对所述文本序列进行词嵌入, 得到词向量; 获取预置知识库中问题的问题特 征向量; 对所述词向量与所述问题特征向量进行相似度检索, 将相似度最高的问题特征向量对 应的问题作为所述文本序列的语义。 6.根据权利要求1所述的人机交 互方法, 其特 征在于, 所述人机交 互方法还 包括: 使用预置编码器对待播 放文字序列进行编码, 得到编码特 征序列; 使用与所述预置编码器相对应的解码器对所述编码特征序列进行解码, 得到预测声谱 图; 使用预置声码器对所述预测声谱图进行 上采样, 得到合成音频。权 利 要 求 书 1/2 页 2 CN 115146066 A 27.根据权利要求6所述的人机交 互方法, 其特 征在于, 所述人机交 互方法还 包括: 基于所述 合成音频的音频长度, 选择相应的动画JSON文件; 获取所述动画JSON文件中各 元素的动画执 行路径与执 行时间; 基于所述各 元素的动画执 行路径与执 行时间绘制各 所述元素。 8.一种人机交 互装置, 其特 征在于, 所述人机交 互装置包括: 文本转换模块, 用于获取语音信号, 并将所述语音信号 转换为文本序列; 分类预测模块, 用于对所述文本序列进行二分类预测, 得到预测结果, 其中, 所述预测 结果包括任务型意图与问答型意图; 语义提取模块, 用于基于所述预测结果进行语义 提取, 得到语义 提取结果; 第一控制模块, 用于若所述预测结果为任务型意图, 则基于所述语义提取结果控制显 示屏幕显示相应的业 务页面; 第二控制模块, 用于若所述预测结果为问答型意图, 则基于所述语义提取结果控制显 示屏幕显示相应的问答结果; 所述分类预测模块具体用于: 对所述文本序列进行词嵌入, 得到词向量; 提取所述文本序列单词级的N ‑Gram特征, 得到特 征向量; 基于所述词向量与所述特 征向量, 计算所述文本序列属于各 标签类别的概 率。 9.一种电子设备, 其特征在于, 所述电子设备包括: 存储器和至少一个处理器, 所述存 储器中存 储有指令; 所述至少一个处理器调用所述存储器中的所述指令, 以使得所述电子设备执行如权利 要求1‑7中任一项所述的人机交 互方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质上存储有指令, 其特征在于, 所述指令被处 理器执行时实现如权利要求1 ‑7中任一项所述的人机交 互方法。权 利 要 求 书 2/2 页 3 CN 115146066 A 3

.PDF文档 专利 人机交互方法、装置、设备及存储介质

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 人机交互方法、装置、设备及存储介质 第 1 页 专利 人机交互方法、装置、设备及存储介质 第 2 页 专利 人机交互方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 02:13:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。