standard library
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210109080.9 (22)申请日 2022.01.28 (71)申请人 重庆长安汽车股份有限公司 地址 400023 重庆市江北区建新 东路260号 (72)发明人 赵喜江 孙澳 唐聪 (74)专利代理 机构 重庆华科专利事务所 5 0123 专利代理师 康海燕 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/205(2020.01) (54)发明名称 一种语义挖掘方法及系统 (57)摘要 本发明提供一种语义挖掘方法及系统, 所述 方法包括对用户语料的采集; 对 未识别或进入闲 聊等没有预设的语料进行分析, 识别出用户的真 实意图; 主动推荐用户语料所属技能板块, 并可 以根据需要灵活设置关键词; 提供上下文查询, 辅助分析用户的真实意图。 本发 明能够提升语音 识别功能对用户语料的理解能力, 让用户可以简 单、 灵活的将指令传达给语音助手 。 权利要求书1页 说明书3页 附图1页 CN 114444513 A 2022.05.06 CN 114444513 A 1. 一种语义挖掘方法, 其特 征在于, 包括: 步骤101, 用户原语采集 步骤102, 技能配置; 根据需要设置语音识别功能各技能板块对应的关键词; 步骤103, 未识别原语数据分析: 依据关键词将每条语料按照技能板块进行分类, 从而 给每一条 未识别的用户原语 推荐一个技能板块; 步骤104, 分析结果显示: 根据实际需要, 设置条件, 来锁定需要统计的数据范围, 并呈 现展示; 步骤105, 联系上下文校核语义: 对于用户意 图不明确的未识别用户原语, 通过辅助查 询调出未识别用户原语相对应的上下文, 联系上下文进一步分析用户实际使用的场景和真 实意图, 最终确定需要定制的语义。 2.根据权利要求1所述的语义挖掘方法, 其特 征在于, 还 包括 步骤106, 在语音功能开发系统上 添加语义。 3.根据权利要求1所述的语义挖掘方法, 其特征在于, 所述步骤101用户原语采集是由 原语采集系统1通过 车机网络将麦克风输入的用户原语数据上传并保存至服 务器。 4.根据权利要求1所述的语义挖掘方法, 其特征在于, 所述步骤104统计的数据范围包 括项目、 时间段、 车辆VI N号码。 5.根据权利要求1所述的语义挖掘方法, 其特征在于, 所述呈现展示形式有两种, 一种 是占比图, 直观的显示各技能板块的占比情况, 来确定哪些技能板块的未识别用户原语占 比较高; 另一种是以列表形式展示每条 未识别用户原语对应的信息 。 6.一种语义挖掘系统, 其特 征在于, 包括: 原语采集系统 (1) , 用于采集用户日常说的原语并将其通过车机网络上传并保存至服 务器; 技能配置模块 (2) , 用于设置各技能对应的关键词; 未识别原语数据分析模块 (3) , 用于对保存在服务器上的语料进行筛选, 提取出未识别 原语, 进行分析; 并通过关键词, 对未识别原语进行识别和筛选, 确定每条用户原语所属的 技能板块, 统计呈现模块 (4) , 用于将数据分析模块 (3) 的结果, 按照预先设置的分类规则呈现, 然 后根据实际要求, 最终确定需要定制的语义; 辅助查询模块 (5) , 用于调出统计呈现模块 (4) 列出来的未识别用于语义相对应的上下 文, 对意图不是很明确的用户原语做进一 步判定, 辅助确定需要定制的语义。 7.根据权利要求6所述的系统, 其特征在在于, 预先设置的分类规则包括排名、 条件ID、 用户原语、 频次、 推荐技能。 8.根据权利要求6所述的系统, 其特征在在于, 所述统计呈现模块 (4) 还用于设置不同 的维度, 对各维度进行分析统计。权 利 要 求 书 1/1 页 2 CN 114444513 A 2一种语义挖掘方法及系统 技术领域 [0001]本发明涉及车载智能语音系统, 具体涉及通过分析未识别的用户原语来挖掘语 义, 调高语音识别功能对用户意图的理解, 用户可以灵活的说出自己的意图。 背景技术 [0002]语音交互是当前人机交互的重要方式之一, 告别传统手动操作交互方式, 语音交 互从某种意义上解放了人类双手, 并实现了人机之间的远距离交互, 为人们生活提供了便 捷。 [0003]车载语音交互在智能座舱中更显得极为重要, 然而当前车载智能语音系统对用户 的意图理解能力比较低, 只能识别到设计之初提前设置好的一些指令, 然而这些指令用户 不可能全部背 下来, 用户不知道控制指 令该怎么说, 只能去反 复的试, 这就限制了用户对语 音功能的使用, 只能停留在他所熟知的几个功能和指令, 也享受不到这份智能产物带来的 便捷。 每个用户都有 各自的语 言习惯, 会有很大的不同, 所以提前设置好的指 令并不一定是 大多数人比较常用的; 指令的数量可能也比较少, 不 一定能够覆盖大多数的用户。 发明内容 [0004]本发明针对现有技术存在的问题, 提供一种语义挖掘方法及系统, 以识别出符合 大多数用户语言习惯的指 令, 找出哪些指令是大家常用的, 都是怎么去说的, 以便将这些语 义添加到智能语音系统中, 通过这样持续不断的更新和完善, 来提升智能语音系统对用户 意图的理解能力, 让用户可以简单、 灵活的将指令传达给语音助手。 [0005]本发明的技 术方案如下: 本发明一方面 提供一种语义挖掘方法, 包括: 步骤101, 用户原语采集 步骤102, 技能配置; 根据需要设置语音识别功能各技能板块对应的关键词。 [0006]步骤103, 未识别原语数据分析: 依据关键词将每条语料按照技能板块进行分类, 从而给每一条 未识别的用户原语 推荐一个技能板块。 [0007]步骤104, 分析结果显示: 根据实际需要, 设置条件, 来锁定需要统计的数据范围, 并呈现展示。 [0008]步骤105, 联系上下文校核语义: 对于用户意图不是很明确的未识别用户原语, 通 过辅助查询调出未识别用户原语相对应的上下文, 语音开发人员联系 上下文, 进一步分析 用户实际使用的场景和真实意图, 最终确定需要定制的语义。 [0009]本发明另一方面还提供一种语义挖掘系统, 包括用户原语的采集系统; 设置原语 提取用关键词的技能配置模块; 未识别原语数据分析模块; 展示结果的统计呈现模块; 联系 上下文进行分析的辅助查询模块。 [0010]用户原语的采集系统; 设置原语提取用关键词的技能配置模块; 未识别原语数据 分析模块; 展示结果的统计呈现模块; 联系上 下文进行分析的辅助查询模块。说 明 书 1/3 页 3 CN 114444513 A 3
专利 一种语义挖掘方法及系统
文档预览
中文文档
6 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共6页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:40
上传分享
举报
下载
原文档
(350.8 KB)
分享
友情链接
T-GVS 009—2022 注塑模具表面纳米硬质PVD涂层评价规范.pdf
GB-T 32904-2016 软件质量量化评价规范.pdf
GB-T 18175-2014 水处理剂缓蚀性能的测定 旋转挂片法.pdf
GB-T 42807-2023 港口基础地理信息交换服务技术要求.pdf
GB-T 19425-2003 防伪技术产品通用技术条件.pdf
DB32-T 3514.8-2019 电子政务外网建设规范 第8部分:运维服务 江苏省.pdf
GB-T 31348-2014 节能量测量和验证技术要求 照明系统.pdf
DB34-T 4145-2022 政务数据目录 核心元数据 安徽省.pdf
TB-T 2604-2016 机车车辆车钩缓冲装置计量器具 货车钩尾框量具.pdf
T-GHDQ 89.2—2022 车载网络安全测试规范 第2部分:车载以太网安全测试规范.pdf
GB-T 39775-2021 能源管理绩效评价导则.pdf
GA-T 913-2019 信息安全技术 数据库安全审计产品安全技术要求.pdf
GB-T 5462-2015 工业盐.pdf
GB-T 21825-2008 玻璃纤维土工格栅.pdf
XF-T 999-2012 防排烟系统性能现场验证方法热烟试验法.pdf
T-CI 102—2022 辛酸亚锡.pdf
DB43-T 2256-2021 信息技术应用创新工程建设规范第 13 部分:国产化信息系统运行维护规范 湖南省.pdf
GB-T 12167-2006 带电作业用铝合金紧线卡线器.pdf
GB-Z 41288-2022 信息安全技术 重要工业控制系统网络安全防护导则.pdf
GB-T 28608-2012 工业用1,4-氧氮杂环己烷(吗啉).pdf
1
/
6
评价文档
赞助2.5元 点击下载(350.8 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。