standard library
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210024232.5 (22)申请日 2022.01.11 (71)申请人 北京仁科互动网络技 术有限公司 地址 100022 北京市朝阳区建外大街甲6号 SK大厦8层 (72)发明人 于鹏  (74)专利代理 机构 北京路浩知识产权代理有限 公司 11002 代理人 任少瑞 (51)Int.Cl. G06F 16/31(2019.01) G06F 16/33(2019.01) G06F 40/279(2020.01) G06F 40/284(2020.01) G06F 40/30(2020.01) (54)发明名称 用户画像生成方法、 装置、 电子设备及存储 介质 (57)摘要 本发明提供一种用户画像生成方法、 装置、 电子设备及存储介质, 所述方法包括: 从目标用 户的目标会话存档中获取目标关键词, 所述目标 关键词用于表征所述目标用户的人口学属性和/ 或行为属性; 基于所述目标关键词, 确定所述目 标用户的第一标签; 基于所述第一标签, 生成所 述目标用户的第一用户画像或更新所述目标用 户的第二用户画像。 通过对目标会话存档的分 析, 可以获取目标关键词, 由于目标会话存档包 括关于目标用户的会话内容, 因而目标关键词可 以表征目标用户的人口学属性和/或行为属性, 进而可以基于目标关键词获取第一标签, 进而可 以基于第一标签生成第一用户画 像, 或者更新第 二用户画 像, 实现基于目标会话存档获取目标用 户的精准画像 。 权利要求书2页 说明书13页 附图2页 CN 114048283 A 2022.02.15 CN 114048283 A 1.一种用户画像生成方法, 其特 征在于, 包括: 从目标用户的目标会话存档中获取目标关键词, 所述目标关键词用于表征所述目标用 户的人口学属性和/或行为属性; 基于所述目标关键词, 确定所述目标用户的第一标签; 基于所述第 一标签, 生成所述目标用户的第 一用户画像或更新所述目标用户的第 二用 户画像。 2.根据权利要求1所述的用户画像生成方法, 其特征在于, 所述从目标用户的目标会话 存档中获取目标关键词, 包括: 对所述目标会话存档的内容进行识别, 获取文字识别结果; 基于所述文字识别结果, 获取 所述目标关键词。 3.根据权利要求2所述的用户画像生成方法, 其特征在于, 所述目标会话存档的内容包 括以下至少一类内容: 文字类内容; 语音类内容; 图片类内容。 4.根据权利要求3所述的用户画像生成方法, 其特征在于, 所述对所述目标会话存档的 内容进行识别, 获取文字识别结果, 包括: 在所述目标会话存档包括语音类内容的情况下, 对所述目标会话存档中的语音类内容 进行语音转文字识别, 获取第一文字识别结果; 和/或, 在所述目标会话存档包括图片类内容的情况下, 对所述目标会话存档中的图片类内容 进行图片转文字识别, 获取第二文字识别结果。 5.根据权利要求2所述的用户画像生成方法, 其特征在于, 所述基于所述文字识别结 果, 获取所述目标关键词, 包括: 基于词义相似度分析模块, 在预设关键词集合中确定与 所述文字识别结果的词义相匹 配的第一目标关键词。 6.根据权利要求2所述的用户画像生成方法, 其特征在于, 所述基于所述文字识别结 果, 获取所述目标关键词, 包括: 基于情绪语义分析模块, 在预设关键词集合中确定与 所述文字识别结果匹配的第 二目 标关键词。 7.根据权利要求1所述的用户画像生成方法, 其特征在于, 所述基于所述目标关键词, 确定所述目标用户的第一标签, 包括: 基于所述目标关键词, 确定与所述目标关键词相对应的暂定标签; 若所述暂定标签与第 二标签为预设标签类别集合中的同一目标类别, 则基于所述暂定 标签和所述第二标签, 确定所述目标用户的所述第一标签; 其中, 所述第二标签为所述第二用户画像中的已有标签。 8.根据权利要求7所述的用户画像生成方法, 其特征在于, 所述基于所述暂定标签和所 述第二标签, 确定所述目标用户的所述第一标签, 包括: 在所述暂定标签的置信度高于所述第 二标签的置信度的情况下, 确定所述暂定标签为 所述第一标签;权 利 要 求 书 1/2 页 2 CN 114048283 A 2在所述第二标签的置信度高于所述暂定标签的置信度的情况下, 确定所述第 二标签为 所述第一标签。 9.根据权利要求7所述的用户画像生成方法, 其特征在于, 所述基于所述暂定标签和所 述第二标签, 确定所述目标用户的所述第一标签, 包括: 接收用户的第一输入; 响应于所述第 一输入, 确定所述暂定标签为所述第 一标签, 其中, 所述第 一输入是所述 用户选择 所述暂定标签为所述第一标签的操作; 或 响应于所述第 一输入, 确定所述第 二标签为所述第 一标签, 其中, 所述第 一输入是所述 用户选择 所述第二标签为所述第一标签的操作。 10.根据权利要求8或9所述的用户画像生成方法, 其特征在于, 所述基于所述第一标 签, 生成所述目标用户的第一用户画像或更新所述目标用户的第二用户画像, 包括: 在所述确定所述暂定标签为所述第一标签的情况下, 基于所述暂定标签, 更新所述目 标用户的第二用户画像。 11.根据权利要求1 ‑9任一项所述的用户画像生成方法, 其特征在于, 在所述从目标用 户的目标会话存档中获取目标关键词之前, 所述方法还 包括: 基于会话存档模块的应用程序编程接口API, 获取 所述目标会话存档。 12.一种用户画像生成装置, 其特 征在于, 包括: 第一获取模块, 用于从目标用户的目标会话存档 中获取目标关键词, 所述目标关键词 用于表征 所述目标用户的人口学属性和/或行为属性; 确定模块, 用于基于所述目标关键词, 确定所述目标用户的第一标签; 生成更新模块, 用于基于所述第一标签, 生成所述目标用户的第一用户画像或更新所 述目标用户的第二用户画像。 13.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求 1至11任一项 所 述用户画像生成方法的步骤。 14.一种非暂态计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算 机程序被处 理器执行时实现如权利要求1至1 1任一项所述用户画像生成方法的步骤。 15.一种计算机程序产品, 包括计算机程序, 其特征在于, 所述计算机程序被处理器执 行时实现如权利要求1至1 1任一项所述用户画像生成方法的步骤。权 利 要 求 书 2/2 页 3 CN 114048283 A 3

PDF文档 专利 用户画像生成方法、装置、电子设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户画像生成方法、装置、电子设备及存储介质 第 1 页 专利 用户画像生成方法、装置、电子设备及存储介质 第 2 页 专利 用户画像生成方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:59上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。