期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于海量公交轨迹数据挖掘的地图匹配算法
陈辉, 蒋圭峰, 姜桂圆, 武继刚
计算机应用    2018, 38 (7): 1923-1928.   DOI: 10.11772/j.issn.1001-9081.2017123041
摘要948)      PDF (958KB)(465)    收藏
针对现有地图匹配算法(如基于经典隐马尔可夫及其变体、先进算法等)对于低频轨迹数据匹配效果不甚理想的问题,提出一种基于海量公交历史轨迹数据的轨迹数据挖掘方法。首先,以公交站点为序列骨架,从大量低频轨迹中挖掘、提取轨迹点数据,进行重组、排序形成高质量高频轨迹数据序列;然后,将高质量高频轨迹数据序列应用基于经典隐马尔可夫模型地图匹配算法,得到公交路线地图匹配结果。与未经过挖掘算法处理的低频轨迹数据的匹配方法相比,所提方法在匹配误差上平均下降6.3%,匹配所需的数据规模、时间大幅缩减;且该方法对于低频、不稳定的噪声数据具有鲁棒性,适用于所有公交路线的地图匹配问题。
参考文献 | 相关文章 | 多维度评价
2. 融合Shapley值和粒子群优化算法的混合特征选择算法
邓秀勤, 李文洲, 武继刚, 刘太亨
计算机应用    2018, 38 (5): 1245-1249.   DOI: 10.11772/j.issn.1001-9081.2017112730
摘要590)      PDF (774KB)(546)    收藏
针对在模式分类问题中,数据往往存在不相关的或冗余的特征,从而影响分类的准确性的问题,提出一种融合Shapley值和粒子群优化算法的混合特征选择算法,以利用最少的特征获得最佳分类效果。在粒子群优化算法的局部搜索中引入博弈论的Shapley值,首先计算粒子(特征子集)中每个特征对分类效果的贡献值(Shapley值),然后逐步删除Shapley值最低的特征以优化特征子集,进而更新粒子,同时也增强了算法的全局搜索能力,最后将改进后的粒子群优化算法运用于特征选择,以支持向量机分类器的分类性能和选择的特征数目作为特征子集评价标准,对UCI机器学习数据集和基因表达数据集的17个具有不同特征数量的医疗数据集进行分类实验。实验结果表明所提算法能有效地删除数据集中55%以上不相关的或冗余的特征,尤其对于中大型数据集能删减80%以上,并且所选择的特征子集也具有较好的分类能力,分类准确率能提高2至23个百分点。
参考文献 | 相关文章 | 多维度评价