(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210640089.2
(22)申请日 2022.06.08
(71)申请人 西北工业大 学
地址 710072 陕西省西安市友谊西路127号
(72)发明人 朱培灿 侯鑫 高超 刘洋
赵银平 王震
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
专利代理师 郭永丽
(51)Int.Cl.
G06V 10/771(2022.01)
G06V 10/774(2022.01)
G06V 10/74(2022.01)
G06V 40/10(2022.01)
(54)发明名称
一种无监督特征选择方法、 装置、 设备和存
储介质
(57)摘要
本发明公开了一种无监督特征选择方法、 装
置、 设备和存储介质, 涉及机器学习中的降维领
域, 解决了受原始数据中包含的噪声和冗余等不
良特征的影 响, 导致在特征选择中最终所选特征
不是最优特征的问题。 无监督特征选择方法具体
包括: 获取n个目标对象中每个目标对象的初始
特征数据, 确定任意两个目标对象的第一相似
度, 构建第一相似矩阵; 基于第一相似矩阵构建
第二相似矩阵, 对第二相似矩阵进行迭代学习得
到目标相似矩阵以及相应的目标投影矩阵, 根据
初始特征数据和目标投影矩 阵确定目标特征数
据。 本发明将相似矩阵的构造和特征选择两个过
程整合到一个统一的框架中, 可以得到最优的相
似矩阵。
权利要求书3页 说明书8页 附图3页
CN 115331066 A
2022.11.11
CN 115331066 A
1.一种无监 督特征选择方法, 其特 征在于, 包括:
获取用户输入的n个目标对象中每个目标对象的初始特征数据, 所述初始特征数据包
括d种特征数据, n和d为大于1的正整数;
根据所述n个目标对象中任意两个目标对象的初始特征数据, 确定所述任意两个目标
对象的第一相似度;
根据所述任意两个目标对象的第一相似度, 以及正则化 参数, 构建第一相似矩阵;
根据用户输入的多个候选对象的初始特征数据, 确定任意两个候选对象的第二相似
度, 并根据所述任意两个候选对 象的第二相似度和所述正则化参数构建第二相似矩阵, 所
述多个候选对象与所述 n个目标对象完全不同或者部分不同;
利用损失函数, 根据所述第一相似矩阵对所述第二相似矩阵进行迭代学习, 得到目标
相似矩阵, 以及相应的目标投影矩阵, 所述 目标相似矩阵为与所述第一相似矩阵的相似度
最高的矩阵;
根据所述初始特征数据和所述目标投影矩阵, 确定目标特征数据, 所述目标特征数据
包括k种特征数量, k为小于d的正整数。
2.根据权利要求1所述的无监督特征选择方法, 其特征在于, 所述利用损 失函数, 根据
所述第一相似矩阵对所述第二相似矩阵进行迭代学习, 得到目标相似矩阵, 以及相应的目
标投影矩阵, 包括:
采用公式(1), 确定所述目标相似矩阵, 以及相应的所述目标投影矩阵, 所述公式(1)满
足以下条件:
其中, A为第一相似矩阵, S为第二相似矩阵, W为目标投影矩阵, || ·||F表示矩阵的
Frobenius范数; k表示目标投影矩阵中的特征数量, λ和α 都是用来调整平衡的参数, LS=DS‑
(S+ST)/2表示所述第二相似矩阵S的拉普拉斯矩阵, 其中的DS表示对角度矩阵, 第i个对角元
素为∑j(sij+sji)/2。
3.根据权利要求2所述的无监督特征选择方法, 其特征在于, 所述目标投影矩阵满足以
下公式(2)的条件:
||W||2,0=k (2)。
4.根据权利要求1 ‑3中任一项所述的无监督特征选择方法, 其特征在于, 所述根据 所述
任意两个目标对象的第一相似度, 以及正则化 参数, 构建第一相似矩阵, 包括:
采用公式(3), 构建所述第一相似矩阵, 所述公式(3)满足以下 条件:
其中, aij代表第i个 目标对象和第j个目标对象之间的相似性, γ≥0代表正则化参数,
正则化项用于避免平凡解。
5.一种无监 督特征选择装置, 其特 征在于, 包括:
获取模块, 用于获取用户输入的n个目标对象中每个目标对象的初始特征数据, 所述初权 利 要 求 书 1/3 页
2
CN 115331066 A
2始特征数据包括d种特 征数据, n和d为大于1的正整数;
第一确定模块, 用于根据 所述n个目标对象中任意两个目标对象的初始特征数据, 确定
所述任意两个目标对象的第一相似度;
第一构建模块, 用于根据 所述任意两个目标对象的第 一相似度, 以及正则化参数, 构建
第一相似矩阵;
第二构建模块, 用于根据用户输入的多个候选对象的初始特征数据, 确定任意两个候
选对象的第二相似度, 并根据所述任意两个候选对象的第二相似度和所述正则化参数构建
第二相似矩阵, 所述多个候选对象与所述 n个目标对象完全不同或者部分不同;
迭代学习模块, 用于利用损 失函数, 根据所述第一相似矩阵对所述第二相似矩阵进行
迭代学习, 得到目标相似矩阵, 以及相应的目标 投影矩阵, 所述目标相似矩阵为与所述第一
相似矩阵的相似度最高的矩阵;
第二确定模块, 用于根据 所述初始特征数据和所述目标投影矩阵, 确定目标特征数据,
所述目标 特征数据包括 k种特征数量, k为小于d的正整数。
6.根据权利要求5所述的一种无监督特征选择装置, 其特征在于, 所述迭代学习 模块具
体用于:
采用公式(1), 确定所述目标相似矩阵, 以及相应的所述目标投影矩阵, 所述公式(1)满
足以下条件:
其中, A为第一相似矩阵, S为第二相似矩阵, W为目标投影矩阵, || ·||F表示矩阵的
Frobenius范数; k表示目标投影矩阵中的特征数量, λ和α 都是用来调整平衡的参数, LS=DS‑
(S+ST)/2表示所述第二相似矩阵S的拉普拉斯矩阵, 其中的DS表示对角度矩阵, 第i个对角元
素为∑j(sij+sji)/2。
7.根据权利要求6所述的一种无监督特征选择装置, 其特征在于, 所述目标投影矩阵满
足以下公式(2)的条件:
||W||2,0=k (2)。
8.根据权利要求7所述的一种无监督特征选择装置, 其特征在于, 所述第 一构建模块具
体用于:
采用公式(3), 构建所述第一相似矩阵, 所述公式(3)满足以下 条件:
其中, aij代表第i个 目标对象和第j个目标对象之间的相似性, γ≥0代表正则化参数,
正则化项用于避免平凡解。
9.一种电子设备, 其特征在于, 所述设备包括处理器和存储器, 所述存储器中存储有至
少一条指 令或至少一段程序, 所述至少一条指 令或所述至少一段程序由所述处理器加载并
执行以实现如权利要求1 ‑4任一项所述的一种无监 督特征选择方法。
10.一种计算机可读存储介质, 其特征在于, 包括计算机指令, 当所述计算机指令在电
子设备上运行时, 使得所述电子设备执行权利要求1 ‑4中任意一项所述的无监督特征选择权 利 要 求 书 2/3 页
3
CN 115331066 A
3
专利 一种无监督特征选择方法、装置、设备和存储介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:32:40上传分享