《计算机应用》唯一官方网站 ›› 2023, Vol. 43 ›› Issue (9): 2673-2678.DOI: 10.11772/j.issn.1001-9081.2022091376
• 2022第10届CCF大数据学术会议 • 上一篇 下一篇
崔昊阳1, 张晖2(), 周雷2, 杨春明1, 李波1, 赵旭剑1
Haoyang CUI1, Hui ZHANG2(), Lei ZHOU2, Chunming YANG1, Bo LI1, Xujian ZHAO1
摘要:
针对最近邻分类算法性能受到所采用的相似度或距离度量方法影响大,且难以选择最优的相似度或距离度量方法的问题,提出一种采用多相似度的基于有序规范实数对的K最近邻分类算法(OPNs-KNN)。首先,在机器学习领域中引入有序规范实数对(OPN)这一新的数学理论,利用多种相似度或距离度量方法将训练集和测试集中所有样本全部转换为OPN,使每个OPN均包含不同的相似度信息;然后再通过改进的最近邻算法对OPN进行分类,实现不同相似度或距离度量方法的结合与互补,从而提高分类性能。实验结果表明,在Iris、seeds等数据集上与距离加权K近邻规则(WKNN)等6种最近邻分类的改进算法相比,OPNs-KNN的分类准确率提高了0.29~15.28个百分点,验证了所提算法能大幅提升分类的性能。
中图分类号: