standard library
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211290775.8 (22)申请日 2022.10.21 (71)申请人 北京红棉小 冰科技有限公司 地址 100080 北京市海淀区北四环西路67 号6层608房间 (72)发明人 戴彬 王宝元  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 专利代理师 王治东 (51)Int.Cl. G05B 19/04(2006.01) G06V 40/16(2022.01) G06V 10/762(2022.01) B25J 13/00(2006.01) B25J 13/08(2006.01)B25J 11/00(2006.01) (54)发明名称 虚拟机器人决策方法、 系统和电子设备 (57)摘要 本发明提供一种虚拟 机器人决策方法、 系统 和电子设备, 虚拟机器人决策模 型的主动决策模 型根据环境信息和历史行为信息在多模态指令 集合中进行主动 决策, 确定目标多模态指令, 实 现根据周围环 境和历史行为给出符合短期环境、 符合常理的指令用于指示虚拟机器人做出行为 的类型; 无意识决策模型根据目标多模态指令和 历史行为信息生成当前行为信息, 由于参考了历 史行为信息, 当前行为信息更符合长期以来的行 为习惯, 更加顺畅和自然; 通过上述方式实现了 程序控制的、 顺畅自然的虚拟机 器人决策。 权利要求书2页 说明书8页 附图6页 CN 115356953 A 2022.11.18 CN 115356953 A 1.一种虚拟机器人决策 方法, 其特 征在于, 包括: 获取环境信息; 将所述环境信息 输入虚拟机器人决策模型, 输出当前 行为信息; 其中, 所述虚拟机器人决策模型包括主动决策模型和无意识决策模型; 主动决策模型 用于根据所述环境信息和预存的历史行为信息在预设多模态指 令集合中进 行主动决策, 确 定目标多模态指令; 无意识决策模型用于根据所述历史行为信息和所述目标多模态指 令生 成所述当前 行为信息 。 2.根据权利要求1所述的虚拟机器人 决策方法, 其特征在于, 所述虚拟机器人 决策模型 还包括决策空间生成模型, 用于根据预存的视频 数据生成多模态指令集 合。 3.根据权利要求2所述的虚拟机器人 决策方法, 其特征在于, 所述根据 预存的视频数据 生成多模态指令集 合, 包括: 通过目标区域检测算法对所述视频 数据进行截取, 得到多个目标区域图像; 对多个所述目标区域图像进行 特征提取, 得到多个目标区域图像特 征; 对多个所述目标区域图像特征进行聚类, 得到多个目标区域图像特征对应的聚类码 本, 其中, 所述聚类码本包括每 个目标区域图像特 征对应的码字; 将所述码字作为多模态指令, 根据所述聚类码本生成所述多模态指令集 合。 4.根据权利要求3所述的虚拟机器人 决策方法, 其特征在于, 所述根据 所述环境信 息和 预存的历史行为信息在预设多模态指令集 合中进行主动决策, 确定目标多模态指令, 包括: 对所述环境信息进行 特征提取, 得到环境信息特 征; 对所述历史行为信息进行第一行为特 征提取, 得到第一历史行为信息特 征; 将所述环境信息特征和所述第一历史行为信息特征输入具有所述多模态指令集合对 应码本的主动决策器进行主动决策, 将主动决策 得到的目标码字作为目标多模态指令 。 5.根据权利要求4所述的虚拟机器人 决策方法, 其特征在于, 所述根据 所述历史行为信 息和所述目标多模态指令生成所述当前 行为信息, 包括: 对所述历史行为信息特 征进行第二行为特 征提取, 得到第二历史行为信息特 征; 根据所述第二历史行为信息特 征和所述目标多模态指令生成当前 行为信息 。 6.根据权利要求5所述的虚拟机器人 决策方法, 其特征在于, 所述根据 所述第二历史行 为信息特 征和所述目标多模态指令生成当前 行为信息, 包括: 获取随机噪声和预设的风格特 征列表中的风格特 征; 将所述第二历史行为信息特征、 所述目标多模态指令、 所述随机噪声和所述风格特征 输入无意识决策器进行 无意识决策, 输出 所述当前 行为信息 。 7.一种虚拟机器人决策系统, 其特 征在于, 包括: 获取单元, 用于获取环境信息; 决策单元, 用于将所述环境信息 输入虚拟机器人决策模型, 输出当前 行为信息; 其中, 所述虚拟机器人决策模型包括主动决策模型和无意识决策模型; 主动决策模型 用于根据所述环境信息和预存的历史行为信息在预设多模态指 令集合中进 行主动决策, 确 定目标多模态指令; 无意识决策模型用于根据所述历史行为信息和所述目标多模态指 令生 成所述当前 行为信息 。 8.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运权 利 要 求 书 1/2 页 2 CN 115356953 A 2行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6任一项所 述虚拟机器人决策 方法的步骤。 9.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机 程序被处 理器执行时实现如权利要求1至 6任一项所述虚拟机器人决策 方法的步骤。 10.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至 6任一项所述虚拟机器人决策 方法的步骤。权 利 要 求 书 2/2 页 3 CN 115356953 A 3

.PDF文档 专利 虚拟机器人决策方法、系统和电子设备

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 虚拟机器人决策方法、系统和电子设备 第 1 页 专利 虚拟机器人决策方法、系统和电子设备 第 2 页 专利 虚拟机器人决策方法、系统和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 04:16:48上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。