(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211279020.8
(22)申请日 2022.10.19
(71)申请人 山东省商业 集团有限公司
地址 250000 山东省济南市历下区经十路
9777号
(72)发明人 王强 娄海凤 王文雯
(74)专利代理 机构 山东明宇知信知识产权代理
事务所(普通 合伙) 3732 9
专利代理师 张永辉
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 40/194(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
G06N 3/08(2006.01)G06N 20/00(2019.01)
(54)发明名称
一种多业态企业潜在客户识别方法
(57)摘要
本发明提供一种多业态企业潜在客户识别
方法, 属于 数据处理技术领域, 包括: 将各业态的
会员数据进行数据融合; 基于机器学习算法技术
识别目标业态的潜在价值的融合会员; 基于深度
学习预测目标业态中单一会员的潜在价值; 建立
推荐模型, 根据会员的价值等级向目标业态中的
会员发送推荐信息; 根据用户针对推荐信息的反
馈内容和反馈数量, 更新会员在目标业态的价值
等级; 根据价值等级变化情况, 对反馈的多篇推
荐信息的内容相似度进行分析。 本发 明能够识别
出目标业态潜在价值会员的愿景的可行性方法,
帮助产业进行 更精准的会员营销。
权利要求书3页 说明书10页 附图1页
CN 115357802 A
2022.11.18
CN 115357802 A
1.一种多业态企业潜在客户识别方法, 其特 征在于, 包括:
将各业态的会员数据进行数据融合, 包括: 利用用户唯一标识技术, 将各业态的会员数
据进行数据融合, 确定至少共同存在于任意两个业态的融合会员, 以及仅存在于任意一业
态中的单一会员; 利用文本识别技术实现标签统一, 根据融合会员的会员标签构造全业态
会员全方位画像;
基于机器学习算法技术识别目标业态的潜在价值的融合会员, 包括: 根据融合会员的
全方位画像, 采用K ‑Means聚类算法对融合会员分配价值等级; 根据分配的融合会员的价值
等级, 确定目标业态中具有潜在价 值的融合会员;
基于深度学习预测目标业态中单一会员的潜在价 值, 包括:
以融合会员群体为训练集、 测试集, 以目标业态的会员标签为特征变量, 以融合会员在
目标业态的价值等级为响应变量, 在训练集上基于stacking建立多分类预测模型, 使用
XGBoost、 LightGBM、 GDBT算法, 利用训练集进行建模、 拟合、 预测, 完成第一层模型, 再将第
一层模型的预测结果作为输入 特征变量, 且将价值等级作为响应变量, 以Bayes分类器作为
元分类器, Bayes分类器经过训练之后, 得到完整的多分类预测模型; 在测试集上对所建预
测模型进行验证, 并将验证通过 的预测模型运用到目标业态中的单一会员上, 以单一会员
在目标业态的价值等级为响应变量, 以目标业态的会员标签为特征变量, 预测目标业态中
单一会员的价 值等级;
建立推荐模型, 根据会员的价值等级向目标业态中的会员发送推荐信息; 根据用户针
对推荐信息的反馈内容和反馈数量, 更新会员 在目标业态的价值等级; 根据价值等级变化
情况, 对反馈的多篇推荐信息的相似度进行分析, 根据相似推荐信息的共同点更新会员全
方位画像。
2.根据权利要求1所述的方法, 其特征在于, 所述利用文本识别技术实现标签统一, 根
据融合会员的会员标签构造全业态会员全方位画像, 包括:
基于全业态数据构建会员全方位的画像, 设定会员标签包括事实标签和分析类标签,
所述事实标签包括属性标签和行为标签;
针对各业态存储会员 信息的数据库进行文本识别, 通过字符特征提取的方式获取符合
会员标签的内容, 填充到对应的会员标签中。
3.根据权利要求1所述的方法, 其特征在于, 所述采用K ‑Means聚类算法对融合会员分
配价值等级, 包括:
步骤1、 获取任意一个业态的数据集Data1数据, 利用归一化公式进行归一化处理, 归一
化公式为:
;
其中, X为Data1中t个标签中的任一标签, n为数据集Data1中样本数量, 归一化处理后的
样本为m1,m2,…,mn, 其中mi=(mi1,mi2,...,mit);
步骤2、 获取 预设的聚类 类别个数 K;
步骤3、 随机选定一个样本点作为第一个聚类中心C1, 其值记作m1计算第一个聚类中心
c1与其余n‑1个样本点的欧氏距离:
;权 利 要 求 书 1/3 页
2
CN 115357802 A
2从这n‑1个距离中选择最大距离所对应的样本点即
所对应样本点作
为第二个聚类中心C2, 即
, 其值记作 m2, 计算C2与n‑2个样本m3,…,mn的欧
式距离D(c2,mi),i=3,4,n;
分别比较m3,…,mn到C1和C2的距离, 选m3,…,mn到C1和C2的最小距离的最大值所对应的
样本点作为第三个聚类中心C3,
, 依次进行下去, 直到选取出k个
聚类中心{c1,c2,…,ck}为止, 并将这 k个聚类中心所对应的类记为{C1,C2,…,Ck};
步骤4、 分别计算每个样本点与k个聚类中心的欧式距离D(ck,mi), 将样本点归到最小距
离所对应的类别中, 即归到
所对应的类别中, 重新分配后的类别仍记为
{C1,C2,…,Ck}, 此时每 个类别中样本的个数记为{n1,n2,…,nn};
步骤5、 计算每个类别中所有样本点的平均值
, 并将其作为新的聚类中
心, 仍记为{c1,c2,…,ck};
步骤6、 给定容忍阈值 ε, 计算代价 函数值:
;
其中mi(k)的上标(k)表示第k类, 计算前后两次迭代的代价函数值的减少量, 若减少量低
于容忍阈值 ε, 则判断算法收敛, 则该聚类算法结束; 若不低于容忍阈值 ε, 则算法不收敛, 转
到步骤4进行循环迭代, 直到 聚类算法收敛, 最终所得{C1,C2,…,Ck}作为k个融合会员价值
等级。
4.根据权利要求1所述的方法, 其特征在于, 所述建立推荐模型, 根据会员的价值等级
向目标业态中的会员发送推荐信息, 包括:
建立推荐模型, 根据目标业态中会员的价值等级确定推荐信息的发送渠道和发送周
期, 所述推荐模 型为S=W*X+E*Y, 其中, S为价值等级, W为预设的发送渠道的权重值, E为发送
周期的权重值; X为输出的发送渠道的预设值, Y为输出的发送周期对应的预设值, X、 Y为正
整数;
得到至少一个组合解的X、 Y, 在多个组合解中选择X、 Y差值最小的一组作 为最终XY进行
输出。
5.根据权利要求1所述的方法, 其特征在于, 所述根据用户针对推荐信 息的反馈内容和
反馈数量, 更新会员在目标业态的价 值等级, 包括:
对反馈内容设定至少一个反馈等级R, 并设置反馈等级R的标记a, 标记a为 “+”表示接受
推荐, 标记a为 “‑”表示不接收推荐;
定期接收用户在上一周期内针对该推荐信息的反馈内容和反馈次数F, 根据反馈内容
确定反馈等级R, 输入反馈模型: T=[(a*R*F)/e], 其中, [ ]表示取整函数, e为等级变化阈
值, T为该周期用户在目标业态中价 值等级的变化 量。
6.根据权利要求1所述的方法, 其特征在于, 所述根据价值等级变化情况, 对反馈的多权 利 要 求 书 2/3 页
3
CN 115357802 A
3
专利 一种多业态企业潜在客户识别方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:47上传分享