期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 不完备邻域粗糙集的不确定性度量和属性约简
姚晟, 汪杰, 徐风, 陈菊
计算机应用    2018, 38 (1): 97-103.   DOI: 10.11772/j.issn.1001-9081.2017061372
摘要549)      PDF (1056KB)(514)    收藏
针对现有的属性约简算法不适合处理数值型属性和符号型属性共同存在的不完备数据,提出了一种拓展不完备邻域粗糙集模型。首先,通过考虑属性值的概率分布来定义缺失属性值之间的距离,可以度量具有混合属性的不完备数据;其次,定义了邻域混合熵来评价属性约简的质量,分析证明了相关的性质定理,并构造了一种基于邻域混合熵的不完备邻域粗糙集属性约简算法;最后从UCI数据集中选取了7组数据进行实验,并分别与基于依赖度的属性约简(ARD)、基于邻域条件熵的属性约简(ARCE)、基于邻域组合测度的属性约简(ARNCM)算法进行了比较。理论分析和实验结果表明,所提算法约简属性比ARD、ARCE、ARNCM分别减少了约1,7,0个,所提算法的分类精度比ARD、ARCE、ARNCM分别提高了约2.5,2.1,0.8个百分点。所提算法不仅能够获得较少的约简属性,同时具有较高的分类精度。
参考文献 | 相关文章 | 多维度评价
2. 多粒度粗糙集模型中属性子集序列的构造方法
姚晟, 徐风, 汪杰
计算机应用    2016, 36 (11): 2950-2953.   DOI: 10.11772/j.issn.1001-9081.2016.11.2950
摘要688)      PDF (671KB)(648)    收藏
针对多粒度粗糙集模型中属性子集序列的构造问题,提出一种基于属性间距离的构造方法。该方法首先引入信息系统中属性间距离的概念,并给出距离的定量计算公式;然后根据公式来计算出各个属性之间的距离;最后根据属性之间距离的远近,得到每个属性的邻域属性集,从而构造出一个属性子集序列。实验结果表明,与随机构造的属性子集序列相比,该方法构造的序列对于实验的每个对象类具有更高的近似精度。
参考文献 | 相关文章 | 多维度评价
3. 不确定数据频繁闭项集挖掘算法
刘慧婷, 沈盛霞, 赵鹏, 姚晟
计算机应用    2015, 35 (10): 2911-2914.   DOI: 10.11772/j.issn.1001-9081.2015.10.2911
摘要468)      PDF (586KB)(499)    收藏
由于不确定数据的向下封闭属性,挖掘全部频繁项集的方法会得到一个指数级的结果。为获得一个较小的合适的结果集,研究了在不确定数据上挖掘频繁闭项集,并提出了一种新的频繁闭项集挖掘算法——NA-PFCIM。该算法将项集挖掘过程看作一个概率分布函数,考虑到基于正态分布模型的方法提取的频繁项集精确度较高,而且支持大型数据库,采用了正态分布模型提取频繁项集。同时,为了减少搜索空间以及避免冗余计算,利用基于深度优先搜索的策略来获得所有的概率频繁闭项集。该算法还设计了两个剪枝策略:超集修剪和子集修剪。最后,在常用的数据集(T10I4D100K、Accidents、Mushroom、Chess)上,将提出的NA-PFCIM算法和基于泊松分布的A-PFCIM算法进行比较。实验结果表明,NA-PFCIM算法能够减少所要扩展的项集,同时减少项集频繁概率的计算,其性能优于对比算法。
参考文献 | 相关文章 | 多维度评价