standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210109080.9 (22)申请日 2022.01.28 (71)申请人 重庆长安汽车股份有限公司 地址 400023 重庆市江北区建新 东路260号 (72)发明人 赵喜江 孙澳 唐聪  (74)专利代理 机构 重庆华科专利事务所 5 0123 专利代理师 康海燕 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/205(2020.01) (54)发明名称 一种语义挖掘方法及系统 (57)摘要 本发明提供一种语义挖掘方法及系统, 所述 方法包括对用户语料的采集; 对 未识别或进入闲 聊等没有预设的语料进行分析, 识别出用户的真 实意图; 主动推荐用户语料所属技能板块, 并可 以根据需要灵活设置关键词; 提供上下文查询, 辅助分析用户的真实意图。 本发 明能够提升语音 识别功能对用户语料的理解能力, 让用户可以简 单、 灵活的将指令传达给语音助手 。 权利要求书1页 说明书3页 附图1页 CN 114444513 A 2022.05.06 CN 114444513 A 1. 一种语义挖掘方法, 其特 征在于, 包括: 步骤101, 用户原语采集 步骤102, 技能配置; 根据需要设置语音识别功能各技能板块对应的关键词; 步骤103, 未识别原语数据分析: 依据关键词将每条语料按照技能板块进行分类, 从而 给每一条 未识别的用户原语 推荐一个技能板块; 步骤104, 分析结果显示: 根据实际需要, 设置条件, 来锁定需要统计的数据范围, 并呈 现展示; 步骤105, 联系上下文校核语义: 对于用户意 图不明确的未识别用户原语, 通过辅助查 询调出未识别用户原语相对应的上下文, 联系上下文进一步分析用户实际使用的场景和真 实意图, 最终确定需要定制的语义。 2.根据权利要求1所述的语义挖掘方法, 其特 征在于, 还 包括 步骤106, 在语音功能开发系统上 添加语义。 3.根据权利要求1所述的语义挖掘方法, 其特征在于, 所述步骤101用户原语采集是由 原语采集系统1通过 车机网络将麦克风输入的用户原语数据上传并保存至服 务器。 4.根据权利要求1所述的语义挖掘方法, 其特征在于, 所述步骤104统计的数据范围包 括项目、 时间段、 车辆VI N号码。 5.根据权利要求1所述的语义挖掘方法, 其特征在于, 所述呈现展示形式有两种, 一种 是占比图, 直观的显示各技能板块的占比情况, 来确定哪些技能板块的未识别用户原语占 比较高; 另一种是以列表形式展示每条 未识别用户原语对应的信息 。 6.一种语义挖掘系统, 其特 征在于, 包括: 原语采集系统 (1) , 用于采集用户日常说的原语并将其通过车机网络上传并保存至服 务器; 技能配置模块 (2) , 用于设置各技能对应的关键词; 未识别原语数据分析模块 (3) , 用于对保存在服务器上的语料进行筛选, 提取出未识别 原语, 进行分析; 并通过关键词, 对未识别原语进行识别和筛选, 确定每条用户原语所属的 技能板块, 统计呈现模块 (4) , 用于将数据分析模块 (3) 的结果, 按照预先设置的分类规则呈现, 然 后根据实际要求, 最终确定需要定制的语义; 辅助查询模块 (5) , 用于调出统计呈现模块 (4) 列出来的未识别用于语义相对应的上下 文, 对意图不是很明确的用户原语做进一 步判定, 辅助确定需要定制的语义。 7.根据权利要求6所述的系统, 其特征在在于, 预先设置的分类规则包括排名、 条件ID、 用户原语、 频次、 推荐技能。 8.根据权利要求6所述的系统, 其特征在在于, 所述统计呈现模块 (4) 还用于设置不同 的维度, 对各维度进行分析统计。权 利 要 求 书 1/1 页 2 CN 114444513 A 2一种语义挖掘方法及系统 技术领域 [0001]本发明涉及车载智能语音系统, 具体涉及通过分析未识别的用户原语来挖掘语 义, 调高语音识别功能对用户意图的理解, 用户可以灵活的说出自己的意图。 背景技术 [0002]语音交互是当前人机交互的重要方式之一, 告别传统手动操作交互方式, 语音交 互从某种意义上解放了人类双手, 并实现了人机之间的远距离交互, 为人们生活提供了便 捷。 [0003]车载语音交互在智能座舱中更显得极为重要, 然而当前车载智能语音系统对用户 的意图理解能力比较低, 只能识别到设计之初提前设置好的一些指令, 然而这些指令用户 不可能全部背 下来, 用户不知道控制指 令该怎么说, 只能去反 复的试, 这就限制了用户对语 音功能的使用, 只能停留在他所熟知的几个功能和指令, 也享受不到这份智能产物带来的 便捷。 每个用户都有 各自的语 言习惯, 会有很大的不同, 所以提前设置好的指 令并不一定是 大多数人比较常用的; 指令的数量可能也比较少, 不 一定能够覆盖大多数的用户。 发明内容 [0004]本发明针对现有技术存在的问题, 提供一种语义挖掘方法及系统, 以识别出符合 大多数用户语言习惯的指 令, 找出哪些指令是大家常用的, 都是怎么去说的, 以便将这些语 义添加到智能语音系统中, 通过这样持续不断的更新和完善, 来提升智能语音系统对用户 意图的理解能力, 让用户可以简单、 灵活的将指令传达给语音助手。 [0005]本发明的技 术方案如下: 本发明一方面 提供一种语义挖掘方法, 包括: 步骤101, 用户原语采集 步骤102, 技能配置; 根据需要设置语音识别功能各技能板块对应的关键词。 [0006]步骤103, 未识别原语数据分析: 依据关键词将每条语料按照技能板块进行分类, 从而给每一条 未识别的用户原语 推荐一个技能板块。 [0007]步骤104, 分析结果显示: 根据实际需要, 设置条件, 来锁定需要统计的数据范围, 并呈现展示。 [0008]步骤105, 联系上下文校核语义: 对于用户意图不是很明确的未识别用户原语, 通 过辅助查询调出未识别用户原语相对应的上下文, 语音开发人员联系 上下文, 进一步分析 用户实际使用的场景和真实意图, 最终确定需要定制的语义。 [0009]本发明另一方面还提供一种语义挖掘系统, 包括用户原语的采集系统; 设置原语 提取用关键词的技能配置模块; 未识别原语数据分析模块; 展示结果的统计呈现模块; 联系 上下文进行分析的辅助查询模块。 [0010]用户原语的采集系统; 设置原语提取用关键词的技能配置模块; 未识别原语数据 分析模块; 展示结果的统计呈现模块; 联系上 下文进行分析的辅助查询模块。说 明 书 1/3 页 3 CN 114444513 A 3

PDF文档 专利 一种语义挖掘方法及系统

文档预览
中文文档 6 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种语义挖掘方法及系统 第 1 页 专利 一种语义挖掘方法及系统 第 2 页 专利 一种语义挖掘方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:40上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。