《计算机应用》唯一官方网站 ›› 2021, Vol. 41 ›› Issue (12): 3468-3474.DOI: 10.11772/j.issn.1001-9081.2021061393
所属专题: 第十八届中国机器学习会议(CCML 2021)
• 第十八届中国机器学习会议(CCML 2021) • 上一篇 下一篇
雷皓云1,2, 任珍文1,3(), 汪彦龙4, 薛爽1, 李浩然1
收稿日期:
2021-05-12
修回日期:
2021-08-30
接受日期:
2021-08-31
发布日期:
2021-12-28
出版日期:
2021-12-10
通讯作者:
任珍文
作者简介:
雷皓云(1999—),男,四川成都人,硕士研究生,CCF会员,主要研究方向:多核聚类、雷达成像技术基金资助:
Haoyun LEI1,2, Zhenwen REN1,3(), Yanlong WANG4, Shuang XUE1, Haoran LI1
Received:
2021-05-12
Revised:
2021-08-30
Accepted:
2021-08-31
Online:
2021-12-28
Published:
2021-12-10
Contact:
Zhenwen REN
About author:
LEI Haoyun, born in 1999, M. S. candidate. His research interests include multiple kernel clustering, radar imaging technology.Supported by:
摘要:
近年来,多核图聚类(MKGC)受到了广泛的关注,这得益于多核学习能有效地避免核函数与核参数的选择,而图聚类能充分挖掘样本间的复杂结构信息。然而现有的MKGC方法存在着如下问题:图学习技术使得模型复杂化,图拉普拉斯矩阵的高秩特性使其难以保证学到的关系图包含精确的c个连通分量(块对角性质),以及大部分方法忽略了候选关系图间的高阶结构信息,使得多核信息难以被充分利用。针对以上问题,提出了一种新的MKGC方法。首先,提出一种新的上界单纯形投影图学习方法,直接将核矩阵投影到图单纯形上,降低了计算复杂度;同时,引入一种新的块对角约束,使学到的关系图能保持精确的块对角属性;此外,在上界单纯形投影空间中引入低秩张量学习来充分挖掘多个候选关系图的高阶结构信息。在多个数据集上与现有的MKGC方法相比,所提出方法计算量小、稳定性高,在聚类精度(ACC)和标准互信息(NMI)指标上具有较大的优势。
中图分类号:
雷皓云, 任珍文, 汪彦龙, 薛爽, 李浩然. 基于上界单纯形投影图张量学习的多核聚类算法[J]. 计算机应用, 2021, 41(12): 3468-3474.
Haoyun LEI, Zenwen REN, Yanlong WANG, Shuang XUE, Haoran LI. Multiple kernel clustering algorithm based on capped simplex projection graph tensor learning[J]. Journal of Computer Applications, 2021, 41(12): 3468-3474.
数据集 | 类型 | 类数 | 样本数 | 特征数 |
---|---|---|---|---|
Yale | 人脸图像 | 15 | 165 | 1 024 |
Jaffe | 人脸图像 | 10 | 213 | 676 |
AR | 人脸图像 | 120 | 840 | 768 |
ORL | 人脸图像 | 40 | 400 | 1 024 |
COIL20 | 物体图像 | 20 | 1 440 | 1 024 |
BA | 手写数字图像 | 36 | 1 404 | 320 |
表1 数据集详细信息
Tab. 1 Details of datasets
数据集 | 类型 | 类数 | 样本数 | 特征数 |
---|---|---|---|---|
Yale | 人脸图像 | 15 | 165 | 1 024 |
Jaffe | 人脸图像 | 10 | 213 | 676 |
AR | 人脸图像 | 120 | 840 | 768 |
ORL | 人脸图像 | 40 | 400 | 1 024 |
COIL20 | 物体图像 | 20 | 1 440 | 1 024 |
BA | 手写数字图像 | 36 | 1 404 | 320 |
数据集 | 度量指标 | MKKM | RMKKM | LKGr | SCMK | SMKL | SPMKC-E | CSGTMKC | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | ||
Yale | ACC | 0.457 | 0.041 | 0.521 | 0.034 | 0.540 | 0.030 | 0.582 | 0.025 | 0.582 | 0.017 | 0.000 | 0.830 | 0.012 | |
NMI | 0.501 | 0.036 | 0.556 | 0.025 | 0.566 | 0.025 | 0.576 | 0.012 | 0.614 | 0.015 | 0.000 | 0.838 | 0.011 | ||
Jaffe | ACC | 0.746 | 0.069 | 0.871 | 0.053 | 0.861 | 0.052 | 0.869 | 0.022 | 0.967 | 0.000 | 1.000 | 0.000 | 1.000 | 0.000 |
NMI | 0.798 | 0.058 | 0.893 | 0.041 | 0.869 | 0.031 | 0.868 | 0.021 | 0.951 | 0.000 | 1.000 | 0.000 | 1.000 | 0.000 | |
ORL | ACC | 0.475 | 0.023 | 0.556 | 0.024 | 0.616 | 0.016 | 0.656 | 0.015 | 0.573 | 0.032 | 0.000 | 0.970 | 0.015 | |
NMI | 0.689 | 0.016 | 0.748 | 0.018 | 0.794 | 0.008 | 0.808 | 0.008 | 0.733 | 0.027 | 0.000 | 0.985 | 0.009 | ||
AR | ACC | 0.286 | 0.014 | 0.344 | 0.012 | 0.314 | 0.015 | 0.544 | 0.024 | 0.263 | 0.009 | 0.000 | 0.902 | 0.008 | |
NMI | 0.592 | 0.014 | 0.655 | 0.015 | 0.648 | 0.007 | 0.775 | 0.009 | 0.568 | 0.014 | 0.000 | 0.971 | 0.009 | ||
COIL20 | ACC | 0.548 | 0.058 | 0.667 | 0.028 | 0.618 | 0.051 | 0.591 | 0.028 | 0.487 | 0.031 | 0.000 | 0.989 | 0.007 | |
NMI | 0.707 | 0.033 | 0.773 | 0.017 | 0.766 | 0.023 | 0.726 | 0.011 | 0.628 | 0.018 | 0.000 | 0.988 | 0.006 | ||
BA | ACC | 0.405 | 0.019 | 0.434 | 0.018 | 0.444 | 0.018 | 0.384 | 0.014 | 0.246 | 0.012 | 0.000 | 0.949 | 0.024 | |
NMI | 0.569 | 0.008 | 0.585 | 0.011 | 0.604 | 0.009 | 0.544 | 0.012 | 0.486 | 0.011 | 0.000 | 0.966 | 0.019 |
表2 基于ACC与NMI的聚类性能比较
Tab. 2 Clustering performance comparison in term of ACC and NMI
数据集 | 度量指标 | MKKM | RMKKM | LKGr | SCMK | SMKL | SPMKC-E | CSGTMKC | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | 数值 | 标准差 | ||
Yale | ACC | 0.457 | 0.041 | 0.521 | 0.034 | 0.540 | 0.030 | 0.582 | 0.025 | 0.582 | 0.017 | 0.000 | 0.830 | 0.012 | |
NMI | 0.501 | 0.036 | 0.556 | 0.025 | 0.566 | 0.025 | 0.576 | 0.012 | 0.614 | 0.015 | 0.000 | 0.838 | 0.011 | ||
Jaffe | ACC | 0.746 | 0.069 | 0.871 | 0.053 | 0.861 | 0.052 | 0.869 | 0.022 | 0.967 | 0.000 | 1.000 | 0.000 | 1.000 | 0.000 |
NMI | 0.798 | 0.058 | 0.893 | 0.041 | 0.869 | 0.031 | 0.868 | 0.021 | 0.951 | 0.000 | 1.000 | 0.000 | 1.000 | 0.000 | |
ORL | ACC | 0.475 | 0.023 | 0.556 | 0.024 | 0.616 | 0.016 | 0.656 | 0.015 | 0.573 | 0.032 | 0.000 | 0.970 | 0.015 | |
NMI | 0.689 | 0.016 | 0.748 | 0.018 | 0.794 | 0.008 | 0.808 | 0.008 | 0.733 | 0.027 | 0.000 | 0.985 | 0.009 | ||
AR | ACC | 0.286 | 0.014 | 0.344 | 0.012 | 0.314 | 0.015 | 0.544 | 0.024 | 0.263 | 0.009 | 0.000 | 0.902 | 0.008 | |
NMI | 0.592 | 0.014 | 0.655 | 0.015 | 0.648 | 0.007 | 0.775 | 0.009 | 0.568 | 0.014 | 0.000 | 0.971 | 0.009 | ||
COIL20 | ACC | 0.548 | 0.058 | 0.667 | 0.028 | 0.618 | 0.051 | 0.591 | 0.028 | 0.487 | 0.031 | 0.000 | 0.989 | 0.007 | |
NMI | 0.707 | 0.033 | 0.773 | 0.017 | 0.766 | 0.023 | 0.726 | 0.011 | 0.628 | 0.018 | 0.000 | 0.988 | 0.006 | ||
BA | ACC | 0.405 | 0.019 | 0.434 | 0.018 | 0.444 | 0.018 | 0.384 | 0.014 | 0.246 | 0.012 | 0.000 | 0.949 | 0.024 | |
NMI | 0.569 | 0.008 | 0.585 | 0.011 | 0.604 | 0.009 | 0.544 | 0.012 | 0.486 | 0.011 | 0.000 | 0.966 | 0.019 |
多核图聚类方法 | Yale | ORL |
---|---|---|
MKKM | 0.105 | 0.327 |
RMKKM | 0.870 | 3.634 |
LKGr | 1.020 | 7.432 |
SCMK | 4.591 | 42.048 |
SMKL | 1.439 | 12.852 |
SPMKC-E | 0.604 | 2.917 |
CSGTMKC | 0.515 | 1.785 |
表3 不同多核图聚类方法的计算时间比较 ( s)
Tab. 3 Computational time comparison of different MKGC methods
多核图聚类方法 | Yale | ORL |
---|---|---|
MKKM | 0.105 | 0.327 |
RMKKM | 0.870 | 3.634 |
LKGr | 1.020 | 7.432 |
SCMK | 4.591 | 42.048 |
SMKL | 1.439 | 12.852 |
SPMKC-E | 0.604 | 2.917 |
CSGTMKC | 0.515 | 1.785 |
1 | ELHAMIFAR E, VIDAL R. Sparse subspace clustering: algorithm, theory, and applications[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(11): 2765-2781. 10.1109/tpami.2013.57 |
2 | LI C G, YOU C, VIDAL R. Structured sparse subspace clustering: a joint affinity learning and subspace clustering framework[J]. IEEE Transactions on Image Processing, 2017, 26(6): 2988-3001. 10.1109/tip.2017.2691557 |
3 | LI X F, REN Z W, LEI H Y, et al. Multiple kernel clustering with pure graph learning scheme[J]. Neurocomputing, 2020, 424: 215-225. 10.1016/j.neucom.2020.10.052 |
4 | LU C Y, FENG J S, LIN Z C, et al. Subspace clustering by block diagonal representation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, 41(2): 487-501. 10.1109/tpami.2018.2794348 |
5 | ZHANG C Q, FU H Z, LIU S, et al. Low-rank tensor constrained multiview subspace clustering[C]// Proceedings of the 2015 IEEE International Conference on Computer Vision. Piscataway: IEEE, 2015: 1582-1590. 10.1109/iccv.2015.185 |
6 | REN Z W, LEI H Y, SUN Q S, et al. Simultaneous learning coefficient matrix and affinity graph for multiple kernel clustering[J]. Information Sciences, 2021, 547: 289-306. 10.1016/j.ins.2020.08.056 |
7 | REN Z W, SUN Q S. Simultaneous global and local graph structure preserving for multiple kernel clustering[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(5): 1839-1851. 10.1109/tnnls.2020.2991366 |
8 | ZHOU S H, LIU X W, LI M M, et al. Multiple kernel clustering with neighbor-kernel subspace segmentation[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020, 31(4): 1351-1362. 10.1109/tnnls.2019.2919900 |
9 | REN Z W, YANG S X, SUN Q S, et al. Consensus affinity graph learning for multiple kernel clustering[J]. IEEE Transactions on Cybernetics, 2021, 51(6): 3273-3284. 10.1109/tcyb.2020.3000947 |
10 | REN Z W, MUKHERJEE M, LLORET J, et al. Multiple kernel driven clustering with locally consistent and selfish graph in Industrial IoT[J]. IEEE Transactions on Industrial Informatics, 2021, 17(4): 2956-2963. 10.1109/tii.2020.3010357 |
11 | WU J L, XIE X X, NIE L Q, et al. Unified graph and low-rank tensor learning for multi-view clustering[C]// Proceedings of the 34th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2020: 6388-6395. 10.1609/aaai.v34i04.6109 |
12 | NIE F P, WANG X Q, JORDAN M I, et al. The constrained Laplacian rank algorithm for graph-based clustering[C]// Proceedings of the 30th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2016: 1969-1976. |
13 | ZHOU P, LU C Y, FENG J S, et al. Tensor low-rank representation for data recovery and clustering[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, 43(5): 1718-1732. 10.1109/tpami.2019.2954874 |
14 | NIE F P, WANG X Q, HUANG H. Clustering and projected clustering with adaptive neighbors[C]// Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2014: 977-986. 10.1145/2623330.2623726 |
15 | DU L, ZHOU P, SHI L, et al. Robust multiple kernel k-means using l2,1-norm[C]// Proceedings of the 24th International Joint Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2015: 3476-3482. |
16 | HUANG H C, CHUANG Y Y, CHEN C S. Multiple kernel fuzzy clustering[J]. IEEE Transactions on Fuzzy Systems, 2012, 20(1): 120-134. 10.1109/tfuzz.2011.2170175 |
17 | KANG Z, WEN L J, CHEN W Y, et al. Low-rank kernel learning for graph-based clustering[J]. Knowledge-Based Systems, 2019, 163:510-517. 10.1016/j.knosys.2018.09.009 |
18 | KANG Z, PENG C, CHENG Q, et al. Unified spectral clustering with optimal graph[C]// Proceedings of the 32nd AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2018: 3366-3373. |
19 | KANG Z, LU X, YI J Fet al. Self-weighted multiple kernel learning for graph-based clustering and semi-supervised classification[J]. Proceedings of the 27th International Joint Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2018: 2312-2318. 10.24963/ijcai.2018/320 |
20 | KANG Z, XU Z, LU X , et al. Self-weighted multiple kernel learning for graph-based clustering and semi-supervised classification[C]// Proceedings of the 27th International Joint Conference on Artificial Intelligence. Menlo Park, CA: AAAI Press, 2018: 2312-2318. 10.24963/ijcai.2018/320 |
21 | REN Z W, SUN Q S, WEI D. Multiple kernel clustering with kernel k-means coupled graph tensor learning[C]// Proceedings of the 35th AAAI Conference on Artificial Intelligence. Palo Alto, CA: AAAI Press, 2021: 9411-9418. |
22 | 章永来,周耀鉴. 聚类算法综述[J]. 计算机应用, 2019, 39(7): 1869-1882. 10.11772/j.issn.1001-9081.2019010174 |
ZHANG Y L, ZHOU Y J. Review of clustering algorithms[J]. Journal of Computer Application, 2019, 39(7): 1869-1882. 10.11772/j.issn.1001-9081.2019010174 | |
23 | 李杏峰,黄玉清,任珍文. 联合低秩稀疏的多核子空间聚类算法[J]. 计算机应用, 2020, 40(6): 1648-1653. |
LI X F, HUANG Y Q, REN Z W. Joint low-rank and sparse multiple kernel subspace clustering algorithm[J]. Journal of Computer Applications, 2020, 40(6): 1648-1653. |
[1] | 李强 白少雄 熊源 袁薇. 基于视觉大模型隐私保护的监控图像定位[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 薛雅丽 徐忠敏 刘世豪. 基于多级小波残差网络的重力数据去噪方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[3] | 况世雄 姚俊波 陆佳炜 王琪冰 肖刚. 基于动态图卷积网络的电梯乘客异常行为数据增强方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[4] | 康斌 陈斌 王俊杰 李昱林 赵军智 咸伟志. 基于多粒度共享语义中心关联的文本到人物检索方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[5] | 张庆 杨凡 方宇涵. 基于多模态信息融合的中文拼写纠错算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[6] | 王昊 王金伟 程鑫 张家伟 吴昊 罗向阳 马宾. 彩色图像JPEG重压缩取证综述(ChinaMFS 2024+14)[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[7] | 王磊 胡节 彭博. 用于半监督火灾检测的分布自适应和动态课程伪标签框架[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[8] | 刘晋文 王磊 马博 董瑞 杨雅婷 艾合塔木江·艾合麦提 王欣乐. 基于弱监督模态语义增强的多模态有害信息检测方法 [J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[9] | 夏雨禾 王晓东 何启学. 基于频域增强图变分学习的时间序列异常检测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 殷兵, 凌震华, 林垠, 奚昌凤, 刘颖. 兼容缺失模态推理的情感识别方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 王子怡 李卫军 刘雪洋 丁建平 刘世侠 苏易礌. 基于Swin Transformer与多尺度特征融合的图像描述方法#br# [J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 方鹏, 赵凡, 王保全, 王轶, 蒋同海. 区块链3.0的发展、技术与应用[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3647-3657. |
[13] | 庞玉东, 李志星, 刘伟杰, 李天昊, 王宁宁. 基于改进实时检测Transformer的塔机上俯视场景小目标检测模型[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3922-3929. |
[14] | 赵欣, 李鑫杰, 徐健, 刘步云, 毕祥. 基于卷积神经网络与Transformer并行的医学图像配准模型[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3915-3921. |
[15] | 何长久, 杨婧涵, 周丕宇, 边昕烨, 吕明明, 董迪, 付岩, 王海鹏. 基于Transformer和门控循环单元的肽序列理论串联质谱图预测方法[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3958-3964. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||