虚拟专题文章

    第八届CCF大数据学术会议(CCF Bigdata 2020)

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 时空轨迹序列模式挖掘方法综述
    康军, 黄山, 段宗涛, 李宜修
    《计算机应用》唯一官方网站    2021, 41 (8): 2379-2385.   DOI: 10.11772/j.issn.1001-9081.2020101571
    摘要941)      PDF (1204KB)(1473)    收藏
    在全球定位、移动通信技术迅速发展的背景下涌现出了海量的时空轨迹数据,这些数据是对移动对象在时空环境下的移动模式和行为特征的真实写照,蕴含了丰富的信息,这些信息对于城市规划、交通管理、服务推荐、位置预测等领域具有重要的应用价值,而时空轨迹数据在这些领域的应用通常需要通过对时空轨迹数据进行序列模式挖掘才能得以实现。时空轨迹序列模式挖掘旨在从时空轨迹数据集中找出频繁出现的序列模式,例如: 位置模式(频繁轨迹、热点区域)、活动周期模式、语义行为模式,从而挖掘时空数据中隐藏的信息。总结近年来时空轨迹序列模式挖掘的研究进展,先介绍时空轨迹序列的数据特点及应用,再描述时空轨迹模式的挖掘过程:从基于时空轨迹序列来挖掘位置模式、周期模式、语义模式这三个方面来介绍该领域的研究情况,最后阐述现有时空轨迹序列模式挖掘方法存在的问题,并展望时空轨迹序列模式挖掘方法未来的发展趋势。
    参考文献 | 相关文章 | 多维度评价
    2. 融合句法指导与字符注意力机制的案情阅读理解方法
    何正海, 线岩团, 王蒙, 余正涛
    计算机应用    2021, 41 (8): 2427-2431.   DOI: 10.11772/j.issn.1001-9081.2020101568
    摘要482)      PDF (813KB)(563)    收藏
    案情阅读理解是机器阅读理解在司法领域的具体应用。案情阅读理解通过计算机阅读裁判文书,并回答相关问题,是司法智能化的重要应用之一。当前机器阅读理解的主流方法是采用深度学习模型对文本词语进行编码,并由此获得文本的向量表示。模型建立的核心问题是如何获得文本的语义表示,以及问题与上下文的匹配。考虑到句法信息有助于模型学习句子主干信息,以及中文字符具有潜在的语义信息,提出了融合句法指导与字符注意力机制的案情阅读理解方法。通过融合句法信息及中文字符信息,提升模型对案情文本的编码能力。在法研杯2019阅读理解数据集上的实验结果表明,所提出的方法与基线模型相比EM值提升了0.816,F1值提升了1.809%。
    参考文献 | 相关文章 | 多维度评价
    3. 基于级联生成对抗网络的遥感图像去雾方法
    孙潇, 徐金东
    计算机应用    2021, 41 (8): 2440-2444.   DOI: 10.11772/j.issn.1001-9081.2020101563
    摘要469)      PDF (2363KB)(517)    收藏
    针对图像训练对的去雾算法难以应对遥感图像中训练样本对不足,且模型泛化的问题,提出一种基于级联生成对抗网络(GAN)的遥感图像去雾方法。为解决成对遥感数据集的缺失,提出了学习雾生成的U-Net GAN(UGAN)和学习去雾的像素注意GAN(PAGAN)。所提方法通过UGAN学习如何使用未配对的清晰遥感图像和带雾遥感图像集在保留遥感图像细节的同时对无雾图像进行加雾处理,然后引导PAGAN学习如何正确地对此类图像进行去雾。为了减少生成的带雾遥感图像和去雾后遥感图像之间的差异,在PAGAN中加入自我注意机制,用生成器从低分辨率图像中所有位置的细节线索生成高分辨率细节特征,用判别器检查图像远端部分的细节特征是否彼此一致。与特征融合注意网络(FFANet)、门控上下文聚合网络(GCANet)和暗通道先验(DCP)等去雾方法相比,级联GAN方法无需大量成对数据来反复训练网络。实验结果表明该方法能够有效地去除雾和薄云,在目视效果和定量指标上均优于对比方法。
    参考文献 | 相关文章 | 多维度评价
    4. 融入时间的兴趣点协同推荐算法
    包玄, 陈红梅, 肖清
    计算机应用    2021, 41 (8): 2406-2411.   DOI: 10.11772/j.issn.1001-9081.2020101565
    摘要442)      PDF (886KB)(329)    收藏
    兴趣点(POI)推荐可以帮助用户发现其没有访问过但可能感兴趣的地点,是重要的基于位置的服务之一。时间在POI推荐中是一个重要因素,而现有POI推荐模型并没有较好地考虑时间因素,因此通过考虑时间因素来提出融入时间的POI协同推荐(TUCF)算法,从而提高POI推荐的效果。首先,分析基于位置的社交网络(LBSN)的用户签到数据,以探索用户签到的时间关系;然后,利用时间关系对用户签到数据进行平滑处理,以融入时间因素并缓解数据稀疏性;最后,根据基于用户的协同过滤方法,在不同时间推荐不同POI给用户。在真实签到数据集上的实验结果表明,与基于用户的协同过滤(U)算法相比,TUCF算法的精确率和召回率分别提高了63%和69%;与具有平滑增强时间偏好的协同过滤(UTE)算法相比,TUCF算法的精确率和召回率分别提高了8%和12%;并且TUCF算法的平均绝对误差(MAE)比U算法和UTE算法分别减小了1.4%和0.5%。
    参考文献 | 相关文章 | 多维度评价
    5. 唐诗宋词中的超网络特性分析
    王高杰, 冶忠林, 赵海兴, 朱宇, 孟磊
    计算机应用    2021, 41 (8): 2432-2439.   DOI: 10.11772/j.issn.1001-9081.2020101569
    摘要415)      PDF (1147KB)(372)    收藏
    目前,唐诗宋词在文学角度的研究成果较多,然而采用基于超图的超网络方法对唐诗宋词进行研究的成果较少,且仅有的这种研究局限于对字频和词频的研究。采用超网络数据分析方法对唐诗宋词进行分析研究有助于探索传统文学角度无法涉及的广度,也有助于发现唐诗宋词所折射出来的文学组词规律和时代背景。因此,首先基于全唐诗和全宋词这两个古文本语料库,分别建立了唐诗超网络和宋词超网络。在构建该超网络时,将一首诗或一首词作为超边,将唐诗中的字或宋词中的字作为超边内的节点。然后,对唐诗超网络和宋词超网络的拓扑指标和网络特性,如节点超度、节点超度分布、超边节点度、超边节点度分布,进行了实验分析,旨在发现唐代诗人和宋代词人的用字、用词和审美倾向。最后,基于李白诗词集、杜甫诗词集、苏轼诗词集、辛弃疾诗词集的诗词作品构建了作品集超网络,并计算了相关网络参数。分析结果表明,唐诗宋词超网络中的最大超度与最小超度相差较大,且其超度分布近似为幂律分布,该结果表明唐诗宋词超网络的无标度特性。另外,唐诗宋词超网络的超边节点度也存在明显的分布特性,具体来说,唐诗超网络的超边节点度较多分布在20~100,宋词超网络的超边节点度较多分布30~130。并且,通过分析发现作品集超网络具有较小的平均路径长度和较大的集聚系数,该结果反映作品集超网络具有小世界特性。
    参考文献 | 相关文章 | 多维度评价
    6. 大规模短时间任务的低延迟集群调度框架
    赵全, 汤小春, 朱紫钰, 毛安琪, 李战怀
    计算机应用    2021, 41 (8): 2396-2405.   DOI: 10.11772/j.issn.1001-9081.2020101566
    摘要368)      PDF (1310KB)(308)    收藏
    大规模数据分析环境中,经常存在一些持续时间较短、并行度较大的任务。如何调度这些低延迟要求的并发作业是目前研究的一个热点。现有的一些集群资源管理框架中,集中式调度器由于主节点的瓶颈无法达到低延迟的要求,而一些分布式调度器虽然达成了低延迟的任务调度,但在最优资源分配以及资源分配冲突方面存在一定的不足。从大规模实时作业的需求出发,设计和实现了一个分布式的集群资源调度框架,以满足大规模数据处理的低延迟要求。首先提出了两阶段调度框架以及优化后的两阶段多路调度框架;然后针对两阶段多路调度过程中存在的一些资源冲突问题,提出了基于负载平衡的任务转移机制,从而解决了各个计算节点的负载不平衡问题;最后使用实际负载以及一个模拟调度器对大规模集群中的任务调度框架进行了模拟和验证。对于实际负载,所提框架的调度延迟控制在理想调度的12%以内;在模拟环境下,该框架与集中式调度器相比在短时间任务的延迟上能够减少40%以上。
    参考文献 | 相关文章 | 多维度评价
    7. 自然场景下多区域特征融合的混合航拍图像分割算法
    杨瑞, 钱晓军, 孙振强, 许振
    计算机应用    2021, 41 (8): 2445-2452.   DOI: 10.11772/j.issn.1001-9081.2020101567
    摘要319)      PDF (1689KB)(484)    收藏
    混合图像分割算法所包含的两个部件中,初始分割不能形成低误分割率的过分割区域集,而区域合并存在缺少区域合并标号选择机制,且存在确定区域合并停止时刻的方式常不满足场景需求的不足。针对以上问题,提出一种基于多级区域信息融合的混合图像分割算法(MRIHS)。首先,使用改进的马尔可夫模型平滑超像素块,以形成初始分割区域;其次,在对初始分割区域进行相似性度量并选定待合并区域对后,利用设计出的区域标号选择机制来选定合并后的区域标号;最后,定义一种最佳合并状态以确定合并停止时刻。为验证MRIHS性能,在视觉对象类别(VOC)、剑桥驾驶标签视频数据库(CamVid)、自建的河湖巡检(rli)数据集上,将其与基于多维特征融合的混合图像分割算法(MFHS)、改进的基于区域合并的FCM图像分割算法(IFRM)、基于段间和边界均质性的混合图像分割算法(IBHHS)、基于多维色彩变换与一致性的混合图像分割算法(MCCHS)进行对比。结果表明:MRIHS在VOC、rli数据集上的边缘召回率(BR)、可达分割精准度(ASA)、查全率、重合率至少分别比其余算法提高了0.43个百分点、0.35个百分点、0.41个百分点、0.84个百分点;欠分割误差(UE)至少减少了0.65个百分点。在CamVid数据集上,MRIHS的查全率、重合率指标至少比其余算法提高了1.11个百分点、2.48个百分点。
    参考文献 | 相关文章 | 多维度评价
    8. 科研项目同行评议专家学术专长匹配方法
    王梓森, 梁英, 刘政君, 谢小杰, 张伟, 史红周
    计算机应用    2021, 41 (8): 2418-2426.   DOI: 10.11772/j.issn.1001-9081.2020101564
    摘要299)      PDF (1602KB)(476)    收藏
    现有的评审专家推荐过程通常依赖于人工匹配,在进行专家推荐时不能充分捕捉评审项目所属学科与专家研究兴趣之间的语义关联,导致专家推荐的精确性较低。为解决这个问题,提出了一种科研项目同行评议专家学术专长匹配方法。该方法构建学术网络以建立学术实体联系,并设计元路径捕捉学术网络中不同节点间的语义关联;使用随机游走策略获得项目所属学科与专家研究兴趣共现关联的节点序列,并通过网络表示学习模型训练得到具有语义关联的项目所属学科与专家研究兴趣的向量表示;在此基础上,按照项目学科树层次结构逐层计算语义相似度,以实现多粒度的同行评议学术专长匹配。在爬取的知网和万方论文数据集、某专家评审数据集、以及百度百科词向量数据集上得到的实验结果表明,所提方法能提升项目所属学科与专家研究兴趣间的语义关联,并能有效应用于项目评审专家的学术专长匹配。
    参考文献 | 相关文章 | 多维度评价
    9. 结合头脑风暴优化的混合蚁群优化算法
    李蒙蒙, 秦伟, 刘艺, 刁兴春
    计算机应用    2021, 41 (8): 2412-2417.   DOI: 10.11772/j.issn.1001-9081.2020101562
    摘要295)      PDF (946KB)(337)    收藏

    特征选择能够有效提升数据分类的性能。为了进一步提升蚁群优化(ACO)在特征选择上的求解能力,提出一种结合头脑风暴优化的混合蚁群优化(ABO)算法。该算法利用信息交流档案维护历史较好解,并通过基于松弛因子的时间最久优先方法动态更新档案。当ACO的全局最优解多次未更新时,采用基于Fuch混沌映射方法的路径-想法转换算子将档案中的路径解转换为想法解,并将其作为初始种群,通过头脑风暴优化(BSO)在更广阔的空间中搜索较好解。对所提算法在6组典型的二分类数据集上进行实验,分析了其参数敏感性,并与混合萤火虫粒子群优化(HFPSO)算法、粒子群优化与引力搜索算法(PSOGSA)以及遗传算法(GA) 这三种典型的演化算法进行对比。实验结果表明,相较于对比算法,所提算法在分类正确率上至少可提高2.88%~5.35%,在F1指标上至少可提高0.02~0.05,验证了所提算法的有效性和优越性。

    参考文献 | 相关文章 | 多维度评价
    10. 基于多粒度时序结构表示的异常检测算法在储层含油性检测中应用
    孟凡, 陈广, 王勇, 高阳, 高德群, 贾文龙
    计算机应用    2021, 41 (8): 2453-2459.   DOI: 10.11772/j.issn.1001-9081.2020101867
    摘要286)      PDF (1265KB)(256)    收藏
    传统储层含油性勘测方法利用地震波穿过地层时产生的相关地震属性和地质钻井资料结合传统地球物理方法进行综合研判,但该类勘测方法往往存在研判成本高且对专家先验知识依赖性强的问题。针对该问题,以江苏油田苏北盆地的地震资料为基础,并结合含油样本的稀疏性和随机性,提出了一种基于多粒度时序结构表示的异常检测算法,直接利用叠后地震道数据进行预测。该算法首先对于单个地震道数据提取多粒度时序结构并形成独立特征表示;其次,在提取多个粒度时序结构表示的基础上进行特征融合,以形成对地震道数据的融合表示;最后,通过对融合后的特征采用代价敏感方法进行联合训练和判别,从而得到对于该地震数据的含油性勘测结果。所提算法在江苏油田实际原始地震资料上进行了实验仿真,实验结果表明:所提算法相比长短期记忆(LSTM)和门控循环单元(GRU)算法在曲线下方的面积(AUC)指标上均提升了10%。
    参考文献 | 相关文章 | 多维度评价
    11. 含负项top- k高效用项集挖掘算法
    孙蕊, 韩萌, 张春砚, 申明尧, 杜诗语
    计算机应用    2021, 41 (8): 2386-2395.   DOI: 10.11772/j.issn.1001-9081.2020101561
    摘要273)      PDF (1361KB)(233)    收藏
    含负项高效用项集(HUI)挖掘是新兴的数据挖掘任务之一。为了挖掘满足用户需求的含负项HUI结果集,提出了含负项top- k高效用项集(THN)挖掘算法。为了提升THN算法的时空性能,提出了自动提升最小效用阈值的策略,并采用模式增长方法进行深度优先搜索;使用重新定义的子树效用和重新定义的本地效用修剪搜索空间;使用事务合并技术和数据集投影技术解决多次扫描数据库的问题;为了提高效用计数的速度,使用效用数组计数技术计算项集的效用。实验结果表明,THN算法的内存消耗约为HUINIV-Mine算法的1/60,约为FHN算法的1/2;THN算法的执行时间是FHN算法的1/10;而且该算法在密集数据集上的性能更好。
    参考文献 | 相关文章 | 多维度评价
2024年 44卷 3期
刊出日期: 2024-03-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会