栏目文章信息

    数据库与数据挖掘 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于MPI的并行PSO混合K均值聚类算法
    吕奕清 林锦贤
    计算机应用    2011, 31 (02): 428-431.  
    摘要1733)      PDF (798KB)(1156)    收藏
    传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算法的全局搜索能力,然后利用该算法提出一种新的并行聚类策略,并将该算法与K均值聚类算法、粒子群优化(PSO)聚类算法进行比较。实验结果表明,该算法不仅具有较好的全局收敛性,而且具有较高的加速比。
    相关文章 | 多维度评价
    2. 基于密度的改进K均值算法及实现
    傅德胜 周辰
    计算机应用    2011, 31 (02): 432-434.  
    摘要1545)      PDF (441KB)(1403)    收藏
    传统的K均值算法的初始聚类中心从数据集中随机产生,聚类结果很不稳定。提出一种基于密度算法优化初始聚类中心的改进K-means算法,该算法选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验证明,改进的K-means算法能够消除对初始聚类中心的依赖,聚类结果有了较大的改进。
    相关文章 | 多维度评价
    3. Apriori算法低频规则的有效性及实现
    张春生 庄丽艳 李艳
    计算机应用    2011, 31 (02): 435-437.  
    摘要1343)      PDF (429KB)(1036)    收藏
    针对经典Apriori算法基于全局、高频两个条件的缺陷,指出事务数据库低频规则的有效性,并通过对C4.5决策树的规则构造,进一步证明事务数据库存在低频规则,在此基础上,给出了一种Apriori低频规则挖掘算法。该算法与经典的Apriori算法兼容,但不是对Apriori算法简单的扩展,而是从理论上打破了Apriori算法基于全局和高频两个条件。最后通过实例用Apriori低频规则挖掘算法和C4.5算法对实例数据库进行挖掘,证明两者的一致性和Apriori低频规则的有效性,同时也证明了Apriori低频规则挖掘算法的有效性。
    相关文章 | 多维度评价
    4. 基于FP-tree的快速构建算法
    陈治平 谭义红 李学勇 栾悉道
    计算机应用    2011, 31 (02): 438-440.  
    摘要1370)      PDF (623KB)(1065)    收藏
    数据库的访问频度是影响关联规则挖掘性能的关键因素之一。通过研究FP-tree算法,提出了一种基于FP-tree的快速构建算法,使FP-tree的构建过程仅需一次数据库扫描。该算法通过动态调整项头表中各项的顺序,同时动态修正FP-tree中项的出现顺序与项头表中各项出现顺序不一致的节点。最后,通过对项头表中非频繁项的剔除与FP-tree中对应项节点的清理,完成FP-tree的构建过程。实验结果证明了该算法的有效性。
    相关文章 | 多维度评价
    5. 基于co-occurrence相似度的聚类集成方法
    凌光 王明春 冯嘉毅
    计算机应用    2011, 31 (02): 441-445.  
    摘要1110)      PDF (816KB)(1047)    收藏
    首先提出了一种基于属性值的co-occurrence相似度概念,通过对其进一步的研究,提出了3个等价性表述;然后对属性值之间的co-occurrence相似度进行引申,给出了数据对象之间co-occurrence相似度的定义,并将其成功应用到聚类集成方法中。利用co-occurrence相似度在计算某个初始聚类结果中数据对象之间的相似度时,充分考虑了其他初始聚类结果和该初始聚类结果之间的相互影响和联系。实验表明, 基于co-occurrence相似度的聚类集成(CSCE)方法能有效识别数据之间的细微结构,有助于提高聚类集成的效果。
    相关文章 | 多维度评价
    6. 基于量子遗传算法的XML聚类方法
    蒋勇 谭怀亮 李光文
    计算机应用    2011, 31 (02): 446-449.  
    摘要1276)      PDF (615KB)(1072)    收藏
    主要用模式分析的核方法与量子遗传算法相结合研究XML聚类,提出了一种基于量子遗传算法混合核聚算法的XML文档聚类新方法。该方法先对XML文档约简,以频繁标签序列建立向量空间核的核矩阵,用高斯核函数求解初始聚类和聚类中心,然后用初始聚类中心构造量子遗传算法的初始种群,通过量子遗传算法与核聚算法相结合求得全局最优解的聚类。实验结果表明,使用该算法的聚类比改进的核聚算法、K均值算法等单一方法具有良好的收敛性、稳定性和更高的全局最优。
    相关文章 | 多维度评价
    7. 流数据上的频繁项挖掘算法
    屠莉 陈崚
    计算机应用    2011, 31 (02): 450-453.  
    摘要1351)      PDF (583KB)(1064)    收藏
    提出了一种流数据上的频繁项挖掘算法(SW-COUNT)。该算法通过数据采样技术挖掘滑动窗口下的数据流频繁项。给定的误差ε,SW-COUNT可以在O(ε-1)空间复杂度下,检测误差在εn内的数据流频繁项,对每个数据项的平均处理时间为O(1)。大量的实验证明,该算法比其他类似算法具有较好的精度质量以及时间和空间效率。
    相关文章 | 多维度评价
    8. 基于捕食逃逸PSO的贝叶斯网络分类器
    孔宇彦 姚金涛 李强 祝胜林 张明武
    计算机应用    2011, 31 (02): 454-457.  
    摘要1281)      PDF (678KB)(945)    收藏
    构造精确的贝叶斯网络分类器已被证明为NP难问题,提出了一种基于捕食逃逸粒子群优化(PSO)算法的通用贝叶斯网络分类器,能有效避免数据预处理时的属性约简对分类效果的直接影响,实现对贝叶斯网络结构的精确学习和搜索。另外,将所提出的分类器应用于高职院校就业预测分析,并在Weka平台上实现对该分类器的构建和验证,与其他几种贝叶斯网络分类器的对比实验结果表明,该分类器具有更好的性能。
    相关文章 | 多维度评价
    9. 集成Spring和Aglets的远程数据库访问技术
    黄大荣 黄惠敏
    计算机应用    2011, 31 (02): 458-461.  
    摘要1114)      PDF (583KB)(1059)    收藏
    针对传统Client/Server计算模式远程数据库访问的不足,提出了一种集成Spring和Aglets的远程数据库访问技术。将移动代理Aglets运用到远程数据库访问系统中,能够明显的提高通信效率,改善系统性能,从而进一步利用Spring作为整个系统的基础框架,将系统的各个组成部分都纳入到Spring控制反转(IoC)容器中进行统一管理,可提高软件的可维护性和灵活性。实验结果表明,与传统Client/Server计算模式的远程数据库访问方法对比,该技术具有明显的性能优势。
    相关文章 | 多维度评价
    10. 计算资源共享平台中非集中式的元数据管理
    蒋炎华
    计算机应用    2011, 31 (02): 462-465.  
    摘要1259)      PDF (680KB)(980)    收藏
    提出了计算资源共享平台中的一种非集中式元数据管理方法,它利用对等网络的方式把数据和元数据分散到网络上的其他节点,而不是在后台服务器端。该方法可以在平台运行数据密集型应用时支持大容量的并行工作机读写数据,同时具有随机的访问、灵活的访问粒度、支持高负载的并行读写的特点。运用了分布式哈希表技术,把大容量元数据划分成树型结构的分段树的形式。描述了数据与元数据的读写与追加新数据的过程。测试结果表明:该方法针对3D图像渲染类数据密集型应用,在不同的工作机并行访问与读写过程中,可以获得很高的聚集带宽与平均读写带宽。
    相关文章 | 多维度评价
    11. 多重粗糙模糊集模型
    黄光球 王伟
    计算机应用    2010, 30 (12): 3366-3370.  
    摘要1273)      PDF (758KB)(1081)    收藏
    为了充分揭示知识颗粒间的重叠性、对象的重要度差别及其多态性,基于多重集合,对Dubois粗糙模糊集意义下的粗糙模糊集模型的论域进行了扩展,提出了基于多重集的粗糙模糊集模型,给出了该模型的完整定义、相关定理和重要性质,其中包括多重粗糙模糊近似集、近似精度和可定义集的定义及其各种性质的证明、多重集意义下的粗糙模糊近似算子之间的关系及其与Dubois意义下的粗糙模糊近似算子之间的关系等。多重粗糙模糊集可用于从具有一对多依赖性关系的且具有模糊特性的数据中挖掘知识。
    相关文章 | 多维度评价
    12. 基于社区划分的联机分析处理查询优化方案
    何昭青 周攀 杨科华
    计算机应用    2010, 30 (12): 3371-3373.  
    摘要892)      PDF (740KB)(1145)    收藏
    针对P2P环境下的联机分析处理(OLAP)查询节点数目不断增加时,易造成网络拥塞、查询效率降低的问题,提出一种基于社区划分的OLAP查询优化方案。该方案构建一个虚拟的社区网,并在此结构上设计了一种基于社区划分的多维数据集(CPDS)的OLAP查询优化算法。实验结果表明,该算法能有效避免因网络节点数目递增而导致的网络负载加剧问题,能有效地减少网络拥塞,优化了OLAP的查询效率,进一步提高P2P环境下OLAP的决策分析性能。
    相关文章 | 多维度评价
    13. 不完备灰色信息系统的粗集模型
    林耀进 李进金 吴顺祥 林耀进
    计算机应用    2010, 30 (12): 3374-3376.  
    摘要1382)      PDF (540KB)(1121)    收藏
    提出一种属性值为区间灰数的不完备信息系统。首先根据区间灰数的定义,提出了区间灰数的一些运算性质,并定义了不完备灰色信息系统;然后,根据灰相似度,提出了变精度灰相似关系,并根据变精度灰相似关系引出了上、下近似算子;最后给出了约简的实际操作方法,并通过典型例子验证了该方法的有效性。
    相关文章 | 多维度评价
    14. 基于粗糙集的混合属性数据聚类算法
    范黎林 王娟
    计算机应用    2010, 30 (12): 3377-3379.  
    摘要1679)      PDF (521KB)(1047)    收藏
    传统聚类方法将对象严格地划分到某一类,但是很多时候边界对象不能被严格地划分。基于粗糙集的k-means聚类算法和基于粗糙集的leader聚类算法,利用粗糙集理论将数据对象划分到一个簇的上近似集或下近似集当中,提供了一种新的处理不确定性的视角,很好地解决了这种边界不确定问题。但其缺点是不能处理混合属性数据,聚类结果对初值有明显的依赖性。针对这些算法存在的不足,给出了一种适用于混合属性数据的距离定义,对初始值的选取提出了改进办法,提出了一种基于粗糙集的混合属性数据聚类算法。仿真实验证明,在不确定聚类簇数的情况下,该算法的聚类准确率比传统k-means算法明显提高。
    相关文章 | 多维度评价
    15. 关系数据的中心权重模糊聚类算法
    贺杨成 王士同 江南
    计算机应用    2010, 30 (12): 3380-3384.  
    摘要993)      PDF (771KB)(1061)    收藏
    k中心点算法仅仅用一个点去代表整个类显然是不足的,这必然会影响聚类结果的准确性。因此提出了一种关系数据的中心权重模糊聚类算法,在该算法中给每一个属于这个类的对象赋予一个中心权重以此来表示其作为这个类的代表对象的可能性程度,这种机制使类中的多个对象来代表整个类而不是利用类中的一个对象来代表整个类。实验结果表明,该算法能更好地发现数据集中潜在的内部结构及对象之间的关系,得到每个聚类结果更加准确的描述。
    相关文章 | 多维度评价
    16. 基于知识的土地利用数据综合
    袁璐 刘峰 廖洁
    计算机应用    2010, 30 (12): 3385-3387.  
    摘要911)      PDF (851KB)(1184)    收藏
    为解决手工综合土地利用现状图过程中存在的主观性大、综合规则难于用精确的数学语言和形式准确表述的问题,介绍了知识库与推理机的概念,提出了基于知识的土地利用数据自动综合方法,在综合知识库的支持下,利用推理机实现零星地物、线状地物、图斑三大类土地利用数据的自动综合,同时考虑了人机协同作用。实验结果表明,该方法实现了计算机参与地图综合的过程,提高了综合效率。
    相关文章 | 多维度评价
    17. 基于模糊相关度的模糊C均值聚类加权指数研究
    肖满生 阳娣兰 张居武 唐文评
    计算机应用    2010, 30 (12): 3388-3390.  
    摘要1162)      PDF (679KB)(1060)    收藏
    在极小化模糊C均值(FCM)聚类目标函数的过程中,针对目前模糊加权指数m的确定缺乏理论依据和有效评价方法的问题,提出了一种基于模糊相关度的模糊加权指数计算方法。首先定义模糊相关度的聚类有效性函数,然后通过Gauss迭代计算FCM聚类有效性并将其反馈到模糊加权指数的变化中,从而使m收敛到一个稳定的最优解。理论分析和实验结果表明,该算法是有效的,所得到加权指数m符合预期的结果。
    相关文章 | 多维度评价
    18. 基于Apriori图挖掘算法的优化及其在3D构造解析的应用
    陈立宁 罗可
    计算机应用    2010, 30 (12): 3391-3396.  
    摘要1086)      PDF (956KB)(1055)    收藏
    基于Apriori的图挖掘(Apriori-based Graph Mining,AGM)算法结构简单,以递归统计为基础,但在面临庞大图数据集时,由于存在子图同构问题,在生成候选子图时容易产生很多冗余子图,增大了计算时间的开销。因此在AGM算法基础上提出一种改进方法,通过增加约束来减少候选子图生成数量,同时引入三次元坐标对图的顶点间的距离进行计算,并归结到边的标识当中,以处理三维图结构数据。通过改进算法对化学化合物进行分析,描述其三维化学结构以及生理活性上的相互关系,并测试了不同条件下改进方法的时间开销,实验结果表明在边标识数较多的情况下改进算法比原算法缩短了计算时间,提高了效率。
    相关文章 | 多维度评价
    19. 基于自然语言理解的SPARQL本体查询
    张宗仁 杨天奇
    计算机应用    2010, 30 (12): 3397-3400.  
    摘要2158)      PDF (774KB)(1341)    收藏
    为了用户能够方便地获取本体知识,提出了基于自然语言理解的SPARQL本体查询。利用Stanford Parser分析用户的自然语言查询,根据语法构建查询三元组,与关键词的方法相比,有效地减少了组合的个数。结合用户词典,能较准确地把查询三元组的词汇映射到本体实体。分值计算时除了考虑词语的形式相似和语义相似外,还考虑了概念的模糊性,尽量返回具体的概念。利用本体推理获取隐藏在本体中的信息,对查询进行过滤和限制,提高了准确率。用户通过图形交互界面和系统进行交互,选择需要的结果,最后返回树形查询结果,并能看到相关的信息。实验结果表明,该方法达到了预期的效果。
    相关文章 | 多维度评价
    20. 基于统计主题模型的多粒度Web文档标注
    袁柳 张龙波
    计算机应用    2010, 30 (12): 3401-3406.  
    摘要1316)      PDF (1269KB)(1177)    收藏
    针对已有Web文档语义标注技术在标注完整性方面的缺陷,将潜在狄里克雷分配(LDA)模型用于对Web文档添加语义标注。考虑到Web文档具有明显的领域特征,在传统的LDA模型中嵌入领域信息,提出Domain-enable LDA模型,提高了标注结果的完整性并避免了对词汇主题的强制分配;同时在文档隐含主题和文档所在领域本体概念间建立关联,利用本体概念表达的语义对隐含主题进行准确的解释,使文档的语义清晰化,为文档检索提供有效帮助。根据LDA模型可为每个词汇分配隐含主题的特征,提出多粒度语义标注的概念。在20news-group和WebKB数据集上的实验证明了Domain-enable LDA模型的有效性,并指出对文档进行多粒度标注有助于有效处理不同类型查询。
    相关文章 | 多维度评价
    21. 基于用户兴趣的服务资源分类算法
    郑宁川 徐光伟
    计算机应用    2010, 30 (12): 3407-3409.  
    摘要1591)      PDF (646KB)(1002)    收藏
    在自治网络中对其所拥有的服务资源,依靠改进朴素贝叶斯分类算法,并且结合中国图书馆分类法进行分类,从而有效地提高基于不同用户兴趣的分类准确率。实验结果表明,与传统的朴素贝叶斯算法相比,该方法具有更好的性能。
    相关文章 | 多维度评价
    22. 传染病应急案例共享本体模型研究
    高珊 王文俊 杜磊 张贤坤
    计算机应用    2010, 30 (11): 2924-2927.  
    摘要1681)      PDF (675KB)(1180)    收藏
    世界范围爆发的大规模传染病事件使应急处置人员对规范的应急知识与信息需求急剧增加。为了解决传染病应急案例知识共享与语义冲突问题,对传染病应急案例本体模型(IDECOM)进行了分析与定义,提出了基于本体的传染病应急案例共享框架,并以北京应对SARS事件为例,描述基于本体的传染病应急案例部分知识片段。
    相关文章 | 多维度评价
    23. 音乐命名实体识别方法
    佘俊 张学清
    计算机应用    2010, 30 (11): 2928-2931.  
    摘要1285)      PDF (779KB)(1033)    收藏
    为了能快速、准确地将分散在Web网页中的音乐实体抽取出来,在全方位了解音乐领域中命名实体的特征的基础上,提出了一种规则与统计相结合的中文音乐实体识别方法,并实现了音乐命名实体识别系统。通过测试发现,该系统具有较高的准确率和召回率。
    相关文章 | 多维度评价
    24. 从经典逻辑知识构建ASP知识库的新方法
    赵岭忠 王雪松 钱俊彦 蔡国永
    计算机应用    2010, 30 (11): 2932-2936.  
    摘要1121)      PDF (696KB)(1021)    收藏
    回答集程序设计(ASP)是一种主流的非单调知识表示工具。为了能够在利用ASP求解问题过程中使用现有的以经典逻辑表示的知识,给出了一种把以谓词逻辑公式表示的约束型知识和定义型知识转化为ASP程序或知识库的新方法,并以实例说明了其有效性。该方法满足转化后ASP程序的回答集与原公式集的模型具有一一对应关系。在实际应用中,该方法提供了一项从现存的以谓词逻辑为表示语言的知识库,构建以ASP为知识表示语言的非单调知识库的技术。
    相关文章 | 多维度评价
    25. 网络评论倾向性分析
    丁建立 慈祥 黄剑雄
    计算机应用    2010, 30 (11): 2937-2940.  
    摘要1320)      PDF (627KB)(1103)    收藏
    Web2.0的兴起使得包括新闻评论、产品评论在内的各种网络评论大量涌现,针对评论信息的监管和利用中的问题多种多样,重点研究其中的网络评论倾向性分析。以知网为基本的语义字典,提出一种改进的词汇相似度计算方法,在此基础上融合同义词词林对词汇的倾向性计算做出改进,进而利用相关语言学知识实现了从细粒度的词汇到粗粒度的评论的倾向性判断。实验表明,该方法对于真实网络环境下的网络评论倾向性分析具有较高的准确率。
    相关文章 | 多维度评价
    26. 数据集成中XML Schema到关系模式的转换方法
    聂玲 刘波
    计算机应用    2010, 30 (11): 2941-2944.  
    摘要1312)      PDF (831KB)(990)    收藏
    根据XML Schema中组件的定义及组件之间的嵌套关系,建立一系列从XML Schema转换成关系模式的结构映射规则和语义映射规则。基于这些规则实现一种转换算法,从Schema中提取出关系模式,并且证明映射得到的关系模式满足4NF。结果表明得到的关系模式不仅包含了XML Schema中所有的结构和内容信息,还能保留大部分语义约束信息,减少存储冗余。
    相关文章 | 多维度评价
    27. 综合文档语义与用户查询语义的XML关键字检索
    黎军 熊海灵
    计算机应用    2010, 30 (11): 2945-2948.  
    摘要1182)      PDF (626KB)(971)    收藏
    为了解决XML关键字查询中语义信息丢失的问题,提出了一种语义相关的关键字检索方法。利用文档的半结构化特点提取文档隐含的语义,利用查询语法捕获用户查询意图,然后根据用户意图查询满足条件的元素,并结合文档语义,由最小最近公共祖先改进为语义相关实体子树集来表达查询结果。实验结果表明,该方法能够有效提高关键字检索结果的查准率。
    相关文章 | 多维度评价
    28. 基于距离的数据流离群点挖掘算法
    杨显飞 张健沛 杨静 初妍
    计算机应用    2010, 30 (11): 2949-2951.  
    摘要1653)      PDF (598KB)(1044)    收藏
    传统的离群点挖掘算法无法有效挖掘数据流中的离群点。针对数据流的无限输入和动态变化等特点,提出一种新的基于距离的数据流离群点挖掘算法。通过Hoeffding定理及独立同分布中心极限定理,对数据流概率分布变化进行动态检测,利用检测结果自适应调整滑动窗口大小对数据流离群点进行挖掘。实验结果表明,该算法在人工数据集和真实数据集KDD-CUP99中可以对数据流中的离群点进行有效挖掘。
    相关文章 | 多维度评价
    29. 关联规则挖掘中Apriori算法的研究与改进
    崔贯勋 李梁 王柯柯 苟光磊 邹航
    计算机应用    2010, 30 (11): 2952-2955.  
    摘要1769)      PDF (628KB)(1375)    收藏
    经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。
    相关文章 | 多维度评价
    30. 基于稀疏表示的数据流异常数据预测方法
    徐雪松 李玲娟 郭立玮
    计算机应用    2010, 30 (11): 2956-2958.  
    摘要1458)      PDF (597KB)(1057)    收藏
    为了提高数据流中异常数据的预测速度与精度,提出一种基于稀疏表示的数据流异常数据预测方法。结合了小波噪声检测方法,采用新近发展起来的稀疏表示工具,对含有异常数据的数据流进行小波变换,并得到一组小波系数,然后对这些系数建立稀疏表示模型。引入随机测量矩阵对小波系数进行变换,恢复小波系数的稀疏性达到预测异常数据的目的。仿真结果表明,在一定条件下该方法可获得相当好的预测效果。
    相关文章 | 多维度评价
    31. 基于核Fisher判别分析的蛋白质氧链糖基化位点的预测
    杨雪梅 李世鹏
    计算机应用    2010, 30 (11): 2959-2961.  
    摘要1807)      PDF (422KB)(917)    收藏
    以各种窗口长度的蛋白质样本序列为研究对象,实验样本用稀疏编码方式编码,使用核Fisher判别分析(KFDA)的方法来预测蛋白质氧链糖基化位点。首先通过非线性映射(由核函数隐含定义)将样本映射到特征空间,然后在特征空间中用Fisher判别分析进行分类。进一步,用多数投票策略对各种窗口下的分类器进行组合以综合多个窗口的优势。实验结果表明,使用组合KFDA的方法预测的效果优于FDA和PCA以及单个KFDA分类器的预测效果,预测准确率为86.5%。
    相关文章 | 多维度评价
    32. 混合结构数据库中基于页迁移的存储分层算法
    王跃清 黄烨 王翰虎 陈梅
    计算机应用    2010, 30 (11): 2962-2964.  
    摘要1153)      PDF (505KB)(894)    收藏
    为了有效地利用固态盘读速快以及磁盘低存储成本的特点,在磁盘和固态盘共存的混合存储结构模型下,设计并实现了一种基于页迁移思想的存储分层算法(SZA)。不同于NUMA的迁移代价计算方法,该算法按照迁移代价选择相应的存储介质,并且对不同工作负载的数据进行迁移。实验结果显示,算法有效地提升了数据库系统的I/O性能,同时大幅度地减少了对闪存的擦写次数。
    相关文章 | 多维度评价
    33. 有效的哈希冲突解决办法
    张朝霞 刘耀军
    计算机应用    2010, 30 (11): 2965-2966.  
    摘要1132)      PDF (493KB)(1160)    收藏
    为了提高解决哈希冲突的效率,在冲突解决机制和数据元素被查找的先验概率的基础上,结合堆排序的优点,提出了一种更有效的处理哈希冲突的方法,称其为以先验概率为基础的哈希大顶堆查找。该方法首先依据关键字被查的先验概率的大小建立相应的哈希大顶堆,然后利用哈希大顶堆进行查找。最后通过严密的效率分析可看出:该方法在最坏的情况下的时间复杂度才为O(n log n),不但降低了冲突时执行查询的查找长度,从而降低查询响应的时间复杂度,而且该方法对于记录数越大的文件越适用。
    相关文章 | 多维度评价
    34. 嵌入式系统动态数据结构优化的并行进化算法
    王晓升
    计算机应用    2010, 30 (11): 2967-2969.  
    摘要1713)      PDF (447KB)(965)    收藏
    为了更好地解决现代多媒体嵌入式系统动态数据结构优化问题,结合NSGA-II和SPEA2两个多目标进化算法,引入岛屿模型和多线程机制,提出了一种并行多目标进化算法--PMOEA-NS。基于多核计算机系统,使用PMOEA-NS具体的3个不同并行算法和串行NSGA-II、SPEA2,对一个实际动态嵌入式应用程序进行优化实验和计算,结果表明:与串行算法NSGA-II和SPEA2相比,并行算法不但提高了优化过程的速度,而且改善了解的质量和多样性。
    相关文章 | 多维度评价
    35. 基于概率及复合指标的矢量数据对比
    周顺平 柳怀颖
    计算机应用    2010, 30 (10): 2602-2604.  
    摘要1316)      PDF (485KB)(973)    收藏
    提出了一种广义的空间实体对比匹配算法──基于概率及复合指标的矢量数据对比算法。该算法由传统匹配单个指标扩展到多个指标,综合考虑矢量数据的属性、空间和图形信息,融合了多种信息指标,并能有效解决非一对一的匹配情况。实验结果表明该方法具有良好的精度和召回率,对比结果可有效应用于矢量地图数据的增量更新。
    相关文章 | 多维度评价
    36. 不确定数据库中概率top-k和排序查询算法
    周帆 李树全 肖春静 吴跃
    计算机应用    2010, 30 (10): 2605-2609.  
    摘要1735)      PDF (883KB)(966)    收藏
    传感器网络等技术的广泛应用产生了大量不确定数据。近年来,对于不确定数据的处理和查询成为数据库和数据挖掘领域研究的热点。其中,传统关系数据库中的top-k查询和排序查询怎样拓展到不确定数据是其中的焦点之一。研究近年来提出的不确定数据库上top-k查询和排序查询算法,归纳和比较目前各种不同查询算法所适应的语义世界和应用场景,并详细分析各种算法的执行效率和算法复杂度。另外,对于不确定数据top-k查询和排序查询所面临的挑战和可能的研究方向进行了总结。
    相关文章 | 多维度评价
    37. 基于外部数据库的图像自动标注改善模型
    李东艳 李绍滋 柯逍
    计算机应用    2010, 30 (10): 2610-2613.  
    摘要1192)      PDF (642KB)(866)    收藏
    针对图像标注中所使用数据集存在的数据不平衡问题,提出一种新的基于外部数据库的自动平衡模型。该模型先依据原始数据库中词频分布来找出低频点,再根据自动平衡模式,对每个低频词,从外部数据库中增加相应的图片;然后对图片进行特征提取,对Corel 5k数据集中的47065个视觉词汇和从外部数据库中追加的图片中提取出来的996个视觉词汇进行聚类;最后利用基于外部数据库的图像自动标注改善模型对图像进行标注。此方法克服了图像标注中数据库存在的不平衡问题,使得至少被正确标注一次的词的数量、精确率和召回率等均明显提高。
    相关文章 | 多维度评价
    38. 半监督的自动聚类
    潘章明
    计算机应用    2010, 30 (10): 2614-2617.  
    摘要1845)      PDF (623KB)(1131)    收藏
    基于进化算法的自动聚类方法在处理聚类结构比较松散的数据集时,存在聚类准确性不高、收敛速度慢的缺陷,为此提出一种半监督的自动聚类算法。该算法从调整染色体的解码过程入手,首先从染色体中分离出聚类数和所有的质心,然后使用最近邻规则滤去部分偏离数据集分布区域的无效质心,最后嵌入先验信息辅助K-均值方法对剩余的质心聚类,进一步优化染色体的解码结果。实验结果表明,该算法对聚类结构紧密或松散的数据集均可给出较精确的聚类结果。
    相关文章 | 多维度评价
    39. 协同过滤中基于用户兴趣度的相似性度量方法
    嵇晓声 刘宴兵 罗来明
    计算机应用    2010, 30 (10): 2618-2620.  
    摘要1412)      PDF (485KB)(1135)    收藏
    在个性化推荐算法中,相似性计算方法是决定算法推荐效率的关键。通过分析传统的相似性度量方法在推荐系统中存在的不足,提出了一种基于用户兴趣度的相似性计算方法。该方法利用用户对不同项目类别的兴趣程度与用户评分相结合进行用户之间的相似性计算,克服了传统相似性计算方法仅仅依据用户评分进行相似性计算的不足,并在一定程度上减少了评价数据稀疏的负面影响。实验结果表明,该方法可以有效地克服传统相似性方法中存在的不足,使推荐系统的推荐质量有明显提高。
    相关文章 | 多维度评价
    40. 结合语义的特征选择方法
    熊忠阳 付玲玲 张玉芳 蒋健
    计算机应用    2010, 30 (10): 2621-2623.  
    摘要1659)      PDF (504KB)(1011)    收藏
    传统的基于词频统计的特征选择方法忽略了特征项本身的语义信息,特征项之间存在冗余使得维数有限的特征空间无法容纳更多的对分类有用的特征项。为此,利用《知网》(HowNet)的中英双语知识词典构建“概念—领域”表,对每个词语查询该表,如果在表中,则把该词语映射到“领域”;否则保留原词。这样不仅可以将较低层概念泛化到较高层概念,还能在一定程度上消除特征项之间的冗余,而且从语义上加强它对所在“领域”的分类贡献度。分别应用信息增益和χ2统计利用该方法进行文本分类实验,结果表明该方法可以有效地提高分类准确率。
    相关文章 | 多维度评价
2024年 44卷 4期
刊出日期: 2024-04-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会