专利 一种用于还原亲人生前声音并智能互动的方法及系统

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210149598.5 (22)申请日 2022.02.18 (71)申请人北京肿瘤医院（北京大学肿瘤医院）地址 100089 北京市海淀区阜成路52号北京肿瘤医院消化内科 (72)发明人张丽燕　沈琳　 (74)专利代理机构无锡苏元专利代理事务所 (普通合伙) 32471 专利代理师王清伟 (51)Int.Cl. G10L 15/26(2006.01) G10L 25/03(2013.01) G10L 25/48(2013.01) G10L 25/51(2013.01) G06N 3/00(2006.01)G06F 40/30(2020.01) (54)发明名称一种用于还原亲人生前声音并智能互动的方法及系统 (57)摘要本发明公开了一种还原亲人生前声音并智能互动的方法及系统，其中，所述方法应用于一智能互动系统，所述系统与第一声音采集装置、第一图像采集装置通信连接，所述方法包括：获得第一用户需求信息；获得第一场景化参数需求集合；获得第二用户的采集许可信息，获得第一声音采集集合和第一图像采集集合；获得第一契合度识别结果；进行所述第一声音采集集合进行场景标签标识；获得第一场景化声音采集集合；根据所述第一场景化声音采集集合进行声音模拟和互动。解决了缅怀方式固定传统且无法满足缅怀需求的技术问题，达到了基于用户需求，综合已逝亲人与用户之间契合度、已逝亲人的声音特征实现还原亲人生前声音并智能互动的技术效果。权利要求书3页说明书13页附图3页 CN 114530155 A 2022.05.24 CN 114530155 A 1.一种用于还原亲人生前声音并智能互动的方法，其特征在于，所述方法应用于一智能互动系统，所述系统与第一声音采集装置、第一图像采集装置通信连接，所述方法包括：获得第一用户需求信息；根据所述第一用户需求信息进行场景化参数确定，获得第一场景化参数需求集合；获得第二用户的采集许可信息，根据所述采集许可信息，基于所述第一声音采集装置和所述第一图像采集装置进行声音和图像采集，获得第一声音采集集合和第一图像采集集合，其中，所述第一声音采集集合和所述第一图像采集集合具有对应关系；根据所述第一场景化参数需求集合进行所述第一图像采集集合和所述第一声音采集集合的场景契合度识别，获得第一契合度识别结果；根据所述第一契合度识别结果进行所述第一声音采集集合进行场景标签标识；根据场景标签标识的所述第一声音采集集合进行语音特征采集参数的特征权重分布，获得第一场景化声音采集集合；根据所述第一场景化声音采集集合进行声音模拟和互动。 2.如权利要求1所述的方法，其特征在于，所述方法还包括：根据所述第一声音采集集合和所述第一图像采集集合进行所述第二用户的性格特征分析，获得第一场景性格特征参数；根据所述第一声音采集集合进行所述第二用户的场景特征词采集，获得第一场景特征词集合；根据所述第一场景特征词集合和所述第一声音采集集合获得第一触发特征词集合，其中，所述第一场景特征词集合中的每一特征词至少存在一个触发特征词；根据所述第一场景性格特征参数、所述第一场景特征词集合和所述第一触发特征词集合进行互动声音控制。 3.如权利要求1所述的方法，其特征在于，所述方法还包括：获得第一语速特征、第一音色特征、第一语气特征，构建语音特征采集参数集合；根据所述第一场景化参数需求集合进行所述语音特征采集参数集合的特征权重预分配，获得第一特征预权重分配结果；根据所述第一声音采集集合的场景标签标识对所述第一特征预权重分配结果进行调整，获得第一特征权重分配结果；根据所述第一特征权重分配结果获得所述第一场景化声音采集集合。 4.如权利要求1所述的方法，其特征在于，所述方法还包括：通过所述第一声音采集装置获得所述第一用户的第一声音信息；通过所述第一声音信息获得第一安全验证指令，通过所述第一图像采集装置进行图像采集，获得第一图像信息，其中，所述第一图像信息包括位置信息；根据所述第一声音信息获得第一语义识别结果和第一场景匹配结果；根据所述第一语义识别结果、所述第一场景匹配结果和所述第一场景化声音采集集合获得第一反馈声音；根据所述第一图像信息和所述第一反馈声音进行安全性校验，当安全性校验通过后通过所述第一反馈声音对所述第一声音信息进行应答。 5.如权利要求 4所述的方法，其特征在于，所述方法还包括：权　利　要　求　书 1/3 页 2 CN 114530155 A 2获得第一反馈声音集合，其中，所述第一反馈声音集合包括多个互动声音的集合，且所述第一反馈声音集合包括回复时间标识；根据所述第一反馈声音集合进行连贯语义分析，基于连贯语义分析结果获得第一危险值；对所述第一反馈声音集合进行单条语义分析，获得第二危险值；基于所述第一危险值和所述第二危险值进行智能对话的预警标识。 6.如权利要求5所述的方法，其特征在于，所述方法还包括：获得所述第一用户的第一反馈信息，其中，所述第一反馈信息为对所述第一反馈声音的反馈信息；根据所述第一反馈信息获得所述第一语义识别结果的第一语义识别失真系数；根据所述第一语义识别失真系数对所述第一场景匹配结果进行调整，获得第二场景匹配结果；基于所述第二场景匹配结果获得所述第一反馈声音。 7.如权利要求1所述的方法，其特征在于，所述根据所述第一场景化声音采集集合进行声音模拟和互动，包括：将所述第一场景化声音采集集合作为输入数据，输入语音生成模型，获得第一语音生成集合；根据判别模型进行所述第一语音生成集合的生成结果进行判别反馈，获得第一判别反馈结果；基于所述第一判别反馈结果进行所述语音生成模型的生成参数调整，基于生成参数调整后的语音生成模型生成反馈互动语音。 8.一种用于还原亲人生前声音并智能互动的系统，其特征在于，所述系统包括：第一获得单元，所述第一获得单元用于获得第一用户需求信息；第二获得单元，所述第二获得单元用于根据所述第一用户需求信息进行场景化参数确定，获得第一场景化参数需求集合；第三获得单元，所述第三获得单元用于获得第二用户的采集许可信息，根据所述采集许可信息，基于第一声音采集装置和第一图像采集装置进行声音和图像采集，获得第一声音采集集合和第一图像采集集合，其中，所述第一声音采集集合和所述第一图像采集集合具有对应关系；第四获得单元，所述第四获得单元用于根据所述第一场景化参数需求集合进行所述第一图像采集集合和所述第一声音采集集合的场景契合度识别，获得第一契合度识别结果；第一确定单元，所述第一确定单元用于根据所述第一契合度识别结果进行所述第一声音采集集合进行场景标签标识；第五获得单元，所述第五获得单元用于根据场景标签标识的所述第一声音采集集合进行语音特征采集参数的特征权重分布，获得第一场景化声音采集集合；第一执行单元，所述第一执行单元用于根据所述第一场景化声音采集集合进行声音模拟和互动。 9.一种用于还原亲人生前声音并智能互动的系统，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权权　利　要　求　书 2/3 页 3 CN 114530155 A 3

专利 一种用于还原亲人生前声音并智能互动的方法及系统

专利一种用于还原亲人生前声音并智能互动的方法及系统