当期目录

    2021年 第41卷 第3期 刊出日期:2021-03-10
    第37届CCF中国数据库学术会议(NDBC 2020)
    面向多核CPU和GPU平台的数据库星形连接优化
    刘专, 韩瑞琛, 张延松, 陈跃国, 张宇
    2021, 41(3):  611-617.  DOI: 10.11772/j.issn.1001-9081.2020091430
    摘要 ( )   PDF (1026KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量索引的CPU和GPU平台上的向量化星形连接算法;然后,通过面向CPU cache和GPU shared memory大小的向量划分来提出基于向量粒度的星形连接操作,从而优化星形连接中向量索引的物化代价;最后,提出了基于压缩向量的星形连接算法,将定长向量索引压缩为变长的二元向量索引,从而在低选择率时提高cache内向量索引的存储访问效率。实验结果表明,在CPU平台上向量化星形连接算法相对于常规的行式或列式连接性能提升了40%以上,在GPU平台上向量化星形连接算法相对于常规星形连接算法性能提升超过了15%;与当前主流的内存数据库和GPU数据库相比,优化的星形连接算法性能相对于最优内存数据库Hyper性能提升了130%,相对于最优的GPU数据库OmniSci性能提升了80%。可见基于向量索引的向量化星形连接优化技术有效地提高了多表连接性能,与传统优化技术相比,基于向量索引的向量化处理提高了较小cache上的数据存储访问效率,压缩向量进一步提升了向量索引在cache内的访问效率。
    面向时序数据的两阶段日志结构合并树文件合并框架
    张凌哲, 黄向东, 乔嘉林, 勾王敏浩, 王建民
    2021, 41(3):  618-622.  DOI: 10.11772/j.issn.1001-9081.2020122053
    摘要 ( )   PDF (793KB) ( )  
    参考文献 | 相关文章 | 计量指标
    时序数据库中日志结构合并树(LSM-tree)在高写入负载或资源受限情况下的不及时的文件合并会导致LSM的C0层数据大量堆积,从而造成近期写入数据的即席查询延迟增加。针对上述问题,提出了一种在保持面向大块数据的高效查询的基础上实现对最新写入的时序数据的低延迟查询的两阶段LSM合并框架。首先将文件的合并过程分为少量乱序文件快速合并与大量小文件合并这两个阶段,然后在每个阶段内提供多种文件合并策略,最后根据系统的查询负载进行两阶段合并的资源分配。通过在时序数据库Apache IoTDB上分别实现传统的LSM合并策略以及两阶段LSM合并框架和测试,结果表明与传统的LSM相比,两阶段的文件合并模块在提升策略灵活性的情况下使即席查询读盘次数大大降低,并且使历史数据分析查询性能提升了约20%。实验结果表明,两阶段的LSM合并框架能够提高近期写入数据的即席查询效率,提高历史数据分析查询性能,而且提升合并策略的灵活性。
    非易失性内存友好的线性哈希索引——NVM-LH
    汤晨, 黄国锐, 金培权
    2021, 41(3):  623-629.  DOI: 10.11772/j.issn.1001-9081.2020091451
    摘要 ( )   PDF (1035KB) ( )  
    参考文献 | 相关文章 | 计量指标
    非易失性内存(NVM)因其大容量、持久化、按位存取和读延迟低等特性而受到人们的关注,但它同时也具有写次数有限、读写速度不均衡等缺点。针对传统线性哈希索引直接在NVM上实现时会导致大量的随机写操作这一问题,提出了一种新的NVM友好的线性哈希索引NVM-LH。NVM-LH通过存储数据时的缓存行对齐实现了缓存友好性,同时提出了无日志的数据一致性保证策略。此外,NVM-LH还通过优化分裂和删除操作来减少NVM写操作。实验结果表明,NVM-LH在空间利用率上比CCEH高30%,在NVM写次数上比CCEH减少了15%左右,表现了更好的NVM友好性。
    基于日志结构合并树的轻量级分布式索引实现方法
    崔双双, 王宏志
    2021, 41(3):  630-635.  DOI: 10.11772/j.issn.1001-9081.2020091543
    摘要 ( )   PDF (896KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对现有基于日志结构合并树(LSM-Tree)实现的分布式数据库仅支持高效的主键查询,无法让用户快速地应用在自己的集群中的问题,提出了基于LSM-Tree的轻量级分布式索引实现方法SIBL。首先,通过对主键属性列建立索引来提高非主键属性的查询效率;然后,提出了分布式索引构建算法以及基于等距取样的索引区间划分算法,从而保证了索引在系统中的均匀分布,并且优化了传统索引的查询算法,将索引文件看作特殊的数据文件分布式地存储在系统中,从而保证了系统的负载均衡和可扩展性;最后,将该方法与华为二级索引方案HIndex在HBase数据库上进行实验来比较二者的索引构建的时间和空间开销、索引的查询性能和系统的负载均衡等性能,验证得出所提出的方法使查询性能提升了50~200倍。
    关系数据库中聚合代数约束的高效发现算法——AAC-Hunter
    张效伟, 江大伟, 陈珂, 陈刚
    2021, 41(3):  636-642.  DOI: 10.11772/j.issn.1001-9081.2020091473
    摘要 ( )   PDF (1077KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对如何更好地维护关系数据库的数据完整性以及帮助审计员找出违规的报销记录的问题,提出了自动发现聚合代数约束(AAC)的算法AAC-Hunter。AAC是一种定义在数据库中两列的聚合结果之间的模糊约束,作用于大多数而非全部记录上。AAC-Hunter首先枚举连接、分组和代数表达式来产生候选AAC,然后分别计算这些候选AAC的值域集合,最后输出AAC结果。但该方法无法应对海量数据带来的性能挑战,因此AAC-Hunter提出了一套启发式规则减小候选约束空间规模以及基于中间结果复用和消除平凡候选AAC的两个优化策略来加速候选AAC的值域集合计算。实验结果表明了对比不使用启发式规则和优化策略的基线算法,AAC-Hunter在TPC-H和European Soccer数据集上分别减小了95.68%和99.94%的约束发现空间,分别缩短了96.58%和92.51%的运行时间。可见AAC-Hunter具备有效性,能够提升审计应用的效率和能力。
    个性化时空数据隐私保护
    刘向宇, 夏国平, 夏秀峰, 宗传玉, 朱睿, 李佳佳
    2021, 41(3):  643-650.  DOI: 10.11772/j.issn.1001-9081.2020091463
    摘要 ( )   PDF (1280KB) ( )  
    参考文献 | 相关文章 | 计量指标
    智能移动终端的普及导致收集的时空数据中个人位置隐私、签到数据隐私、轨迹隐私等敏感信息容易泄露,且当前研究分别针对上述隐私泄露单独提出保护技术,而没有面向用户给出防止上述隐私泄露的个性化时空数据隐私保护方法。针对这个问题,提出一种面向时空数据的个性化隐私保护模型(pqε)-匿名和基于该模型的个性化时空数据隐私保护(PPPST)算法,从而对用户个性化设置的隐私数据(位置隐私、签到数据隐私和轨迹隐私)加以保护。设计了启发式规则对时空数据进行泛化处理,保证了发布数据的可用性并实现了时空数据的高可用性。对比实验中PPPST算法的数据可用率比个性化信息数据K-匿名(IDU-K)和个性化Clique Cloak(PCC)算法分别平均高约4.66%和15.45%。同时,设计了泛化位置搜索技术来提高算法的执行效率。基于真实时空数据进行实验测试和分析,实验结果表明PPPST算法能有效地保护个性化时空数据隐私。
    不平衡时间序列集成分类算法
    曹阳, 闫秋艳, 吴鑫
    2021, 41(3):  651-656.  DOI: 10.11772/j.issn.1001-9081.2020091493
    摘要 ( )   PDF (925KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对现有集成分类方法对不平衡时间序列数据学习能力欠佳的问题,采用优化组件算法性能和集成策略的思路,以异构集成方法即基于变换的集合的层次投票集合(HIVE-COTE)为基础,提出一种不平衡时间序列集成分类算法IMHIVE-COTE。该算法主要包含两个改进内容:首先,增加了一个新的不平衡分类组件SBST-HESCA,引入Boosting结合重采样的思路,并通过交叉验证预测结果来更新样本权重,从而使数据集的重采样过程更有利于提升少数类样本的分类质量;其次,结合SBST-HESCA组件对HIVE-COTE计算框架进行改进,通过优化组件算法的权重使不平衡时间序列分类算法对分类结果拥有更高的投票比重,从而再次提升集成算法整体的分类质量。实验部分对IMHIVE-COTE的性能进行了验证和分析:和对比方法相比,IMHIVE-COTE有最高的整体分类评价,并且在三个不平衡分类指标值上分别得到了最优、最优、第三优的整体分类评价,可以证明IMHIVE-COTE解决不平衡时间序列分类问题的能力明显较高。
    面向自动参数调优的动态负载匹配方法
    沈忱, 邰凌翔, 彭煜玮
    2021, 41(3):  657-661.  DOI: 10.11772/j.issn.1001-9081.2020091424
    摘要 ( )   PDF (867KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对OtterTune等自动参数调优方法采用静态负载描述不够准确的问题,提出了一种动态负载的时序描述方式和动态负载匹配方法。首先,提出一种动态负载描述方法来更准确地刻画负载变化;接着,对于负载匹配中序列不规则、欧氏距离算法不再适用等问题,基于动态时间规整(DTW)算法提出了一种使用数据对齐思想的动态负载匹配算法;最后,将所提出的方法应用于OtterTune上从而形成了基于动态负载的调优工具D-OtterTune,并对其进行若干实验。实验结果表明,和OtterTune原方法相比,动态负载匹配方法对自动参数调优的负载匹配的准确度有稳定幅度的提升,使D-OtterTune准确度提升达到3%。可见在数据密集型应用中,D-OtterTune对整体业务性能可以产生明显影响。
    数据异常情况下遥感影像时间序列分类算法
    任媛媛, 汪传建
    2021, 41(3):  662-668.  DOI: 10.11772/j.issn.1001-9081.2020091425
    摘要 ( )   PDF (1226KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对时序遥感图像数据异常时卷积神经网络对其分类性能较差的问题,提出了一种端到端的多模式与多单模架构相结合的网络结构。首先,通过多元时序模型和单变量时间序列模型对多维时间序列进行多尺度特征提取;然后,基于像素空间坐标信息,通过自动编码形式完成遥感图像的时空序列特征的构建;最后,通过全连接层和softmax函数实现分类。在数据异常(数据缺失和数据扭曲)的情况下,提出的算法和一维卷积神经网络(1D-CNN)、多通道深度神经网络(MCDNN)、时序卷积神经网络(TSCNN)和长短期记忆(LSTM)网络等通用时间序列遥感影像分类算法进行分析比较。实验结果表明,所提的利用端到端的多模式与多单模式架构融合的网络在数据异常的情况下分类精度最高,F1值达到了93.40%。
    人工智能
    基于ZYNQ平台的YOLOv3压缩和加速
    郭文旭, 苏远歧, 刘跃虎
    2021, 41(3):  669-676.  DOI: 10.11772/j.issn.1001-9081.2020060994
    摘要 ( )   PDF (1391KB) ( )  
    参考文献 | 相关文章 | 计量指标
    高精度物体检测网络急剧增加的参数和计算量使得它们很难在车辆和无人机等端侧设备上直接部署使用。针对这一问题,从网络压缩和计算加速两方面入手,提出了一种面向残差网络的新型压缩方案来实现YOLOv3的压缩,并通过ZYNQ平台对这一压缩后的网络进行加速。首先,提出了包括网络裁剪和网络量化两方面的网络压缩算法。网络裁剪方面,给出了针对残差结构的裁剪策略来将网络剪枝分为通道剪枝和残差链剪枝两个粒度,解决了通道剪枝无法应对残差连接的局限性,进一步降低了模型的参数量;网络量化方面,实现了一种基于相对熵的模拟量化方法,以通道为单位对参数进行量化,在线统计模型的参数分布与参数量化造成的信息损失,从而辅助选择最优量化策略来减少量化过程的精度损失。然后,在ZYNQ平台上设计并改进了8比特的卷积加速模块,从而优化了片上缓存结构并结合Winograd算法实现了压缩后YOLOv3的加速。实验结果表明,所提压缩算法较YOLOv3 tiny能够进一步降低模型尺寸,但检测精度提升了7个百分点;同时ZYNQ平台上的硬件加速方法获得了比其他平台更高的能耗比,从而推进了YOLOv3以及其他残差网络在ZYNQ端侧的实际部署。
    基于粗糙集理论的不完备数据分析方法的混合信息系统填补算法
    彭莉, 张海清, 李代伟, 唐聃, 于曦, 何磊
    2021, 41(3):  677-685.  DOI: 10.11772/j.issn.1001-9081.2020060894
    摘要 ( )   PDF (1135KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了提高基于粗糙集理论的不完备数据分析方法(ROUSTIDA)在实际应用中对包含离散型(如整型、字符串型、枚举型)、连续型(如浮点数表达)、缺失型属性的混合信息系统(HIS)数据的填补能力,提出了一种基于粗糙集理论的混合信息系统缺失值填补方法(RSHISMIA)。首先,根据决策属性等价类划分思想并按照决策属性对混合信息系统HIS进行划分,解决了填补后可能出现的决策规则冲突问题;其次,定义混合距离矩阵来合理量化对象间的相似性,从而筛选出具有填补能力的样本并克服ROUSTIDA无法处理连续性属性的缺点;然后,结合近邻思想解决了ROUSTIDA在无差别对象属性值发生冲突情况下无法对相同属性缺失数据进行填补的问题。最后,使用10个UCI标准数据集进行实验,将所提出的方法与ROUSTIDA、K近邻填补(KNNI)算法、随机森林填补(RFI)算法和矩阵分解(MF)等几种经典算法进行了比较。实验结果表明,与ROUSTIDA相比,所提方法在查全率上平均高出81%,在查准率上提升了5%~53%,且其归一化均方根误差(NRMSE)最多减小了0.12。此外,所提方法的分类准确率与ROUSTIDA相比平均提升了7%,且优于KNNI、RFI及MF等填补算法。
    结合改进密度峰值聚类和共享子空间的协同训练算法
    吕佳, 鲜焱
    2021, 41(3):  686-693.  DOI: 10.11772/j.issn.1001-9081.2020071095
    摘要 ( )   PDF (2185KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对协同训练算法在迭代过程中加入的无标记样本的有用信息不足和多分类器对样本标记不一致导致的分类错误累积问题,提出结合改进密度峰值聚类和共享子空间的协同训练算法。该算法先采取属性集合互补的方式得到两个基分类器,然后基于虹吸平衡法则进行改进密度峰值聚类,并从簇中心出发来推进式选择相互邻近度高的无标记样本交由两个基分类器进行分类,最后利用多视图非负矩阵分解算法得到的共享子空间来确定标记不一致样本的最终类别。该算法利用改进密度峰值聚类和相互邻近度选择出更具空间结构代表性的无标记样本,并采用共享子空间来修订标记不一致的样本,解决了因样本误分类造成的分类精度低的问题。在9个UCI数据集上的多组对比实验证明了该算法的有效性,实验结果表明所提算法相较于对比算法在7个数据集上取得最高的分类正确率,在另2个数据集取得次高的分类正确率。
    连续手语识别中的文本纠正和补全方法
    龙广玉, 陈益强, 邢云冰
    2021, 41(3):  694-698.  DOI: 10.11772/j.issn.1001-9081.2020060798
    摘要 ( )   PDF (877KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对基于视频的连续手语识别的文本结果存在语义模糊、语序混乱的问题,提出一种两步法将连续手语识别结果的手语文本转化为通顺、可懂的汉语文本。第一步,基于自然手语规则以及N元语言模型(N-gram)对连续手语识别的结果进行文本调序;第二步,利用汉语通用量词数据集训练双向长短期记忆(Bi-LSTM)网络模型,以解决手语语法无量词的问题,从而提升语句通顺度。使用绝对准确率和最长正确子序列占比作为文本调序的评价指标,实验结果显示,所提方法的文本调序结果绝对准确率为77.06%,最长正确子序列占比为86.55%,量词补全准确率为97.23%。所提的方法能够有效提升连续手语识别的文本结果的通畅度和可懂度,已成功应用于基于视频的连续手语识别,提升了听障人和健听人的无障碍交流体验。
    基于优势演员-评论家算法的强化自动摘要模型
    杜嘻嘻, 程华, 房一泉
    2021, 41(3):  699-705.  DOI: 10.11772/j.issn.1001-9081.2020060837
    摘要 ( )   PDF (975KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对长文本自动摘要任务中抽取式模型摘要较为冗余,而生成式摘要模型时常有关键信息丢失、摘要不准确和生成内容重复等问题,提出一种面向长文本的基于优势演员-评论家算法的强化自动摘要模型(A2C-RLAS)。首先,用基于卷积神经网络(CNN)和循环神经网络(RNN)的混合神经网络的抽取器(extractor)来提取原文关键句;然后,用基于拷贝机制和注意力机制的重写器(rewriter)来精炼关键句;最后,使用强化学习的优势演员-评论家(A2C)算法训练整个网络,把重写摘要和参考摘要的语义相似性(BERTScore值)作为奖励(reward)来指导抽取过程,从而提高抽取器提取句子的质量。在CNN/Daily Mail数据集上的实验结果表明,与基于强化学习的抽取式摘要(Refresh)模型、基于循环神经网络的抽取式摘要序列模型(SummaRuNNer)和分布语义奖励(DSR)模型等模型相比,A2C-RLAS的最终摘要内容更加准确、语言更加流畅,冗余的内容有效减少,且A2C-RLAS的ROUGE和BERTScore指标均有提升。相较于Refresh模型和SummaRuNNer模型,A2C-RLAS模型的ROUGE-L值分别提高了6.3%和10.2%;相较于DSR模型,A2C-RLAS模型的F1值提高了30.5%。
    基于高斯差分特征网络的显著目标检测
    后云龙, 朱磊, 陈琴, 吕燧栋
    2021, 41(3):  706-713.  DOI: 10.11772/j.issn.1001-9081.2020060957
    摘要 ( )   PDF (1463KB) ( )  
    参考文献 | 相关文章 | 计量指标
    中心-邻域对比度理论作为具有生理学依据的一种线索,在传统显著性检测模型中获得了广泛应用,然而该理论却很少显式地应用在基于深度卷积神经网络(CNN)的模型中。为了将经典的中心-邻域对比度理论引入深度卷积网络中,提出了一种基于高斯差分(DoG)特征网络的显著目标检测模型。首先通过在多个尺度的深度特征上构造高斯差分金字塔(DGP)结构以感知图像中显著目标的局部突出特性,进而用所得到的差分特征对语义信息丰富的深度特征进行加权选择,最终实现对显著目标的准确提取。进一步地,在提出的网络设计中采用标准的一维卷积来实现高斯平滑过程,从而在降低计算复杂度的同时实现了网络端到端的训练。通过把所提模型与六种显著目标检测算法在四个公用数据集上的实验结果进行对比,可知所提模型取得的结果在平均绝对误差(MAE)和最大F度量值的定量评价中均取得了最优表现,尤其是在DUTS-TE数据集上所提模型取得的结果的最大F度量值和平均绝对误差分别达到了0.885和0.039。实验结果表明,所提模型在复杂自然场景中对于显著目标具有良好的检测性能。
    基于面部特征图对称的人脸正面化生成对抗网络算法
    李虹霞, 秦品乐, 闫寒梅, 曾建潮, 鲍骞月, 柴锐
    2021, 41(3):  714-720.  DOI: 10.11772/j.issn.1001-9081.2020060779
    摘要 ( )   PDF (1432KB) ( )  
    参考文献 | 相关文章 | 计量指标
    目前人脸正面化研究主要解决人脸偏转问题,而对监控视频等现实场景中同时受偏转和俯仰变化影响的侧脸的正面化生成关注较少,针对这个问题和多角度侧脸生成的正面人脸图存在身份信息保留不全的问题,提出了一种基于特征图对称模块和眼周特征保留损失的生成对抗网络(GAN)。首先,根据人脸对称性先验,提出特征图对称模块,先使用人脸关键点检测器检测出侧脸鼻尖点位置,再将编码器提取到的特征图依照鼻尖位置进行镜像对称,从而在特征层面上缓解面部信息缺失的问题。其次,借鉴眼周识别思想,在现有的生成图身份保留方法中加入了眼周特征保留损失以训练生成器生成逼真的且保留身份信息的人脸正面图像。实验结果表明,所提算法得到的生成图面部细节保留较好,且在CAS-PEAL-R1数据集的所有俯角下人脸的平均Rank-1识别率为99.03%,可见该算法能够有效解决多角度侧脸的正面化问题。
    基于低秩行为信息和多尺度卷积神经网络的人体行为识别方法
    蒋丽, 黄仕建, 严文娟
    2021, 41(3):  721-726.  DOI: 10.11772/j.issn.1001-9081.2020060958
    摘要 ( )   PDF (1376KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对人体行为识别中传统行为信息获取方法需要繁琐步骤和各类假设的问题,结合卷积神经网络(CNN)在图像视频处理中的优越性能,提出了一种基于低秩行为信息(LAI)和多尺度卷积神经网络(MCNN)的人体行为识别方法。首先,对行为视频进行分段,并分别对每个视频段进行低秩学习以提取到相应的LAI,然后在时间轴上对这些LAI进行连接以获取整个视频的LAI,进而有效捕获视频中的行为信息,避免了繁琐的提取步骤和各类假设。其次,针对LAI的特点,设计了MCNN模型。该模型通过多尺度卷积核获取不同感受野下的LAI行为特征,并合理设计各卷积层、池化层及全连接层来进一步提炼特征并最终输出行为类别。将所提出的方法在KTH和HMDB51两个基准数据库上进行性能验证,同时设计和进行了三组对比实验。实验结果表明,所提方法在两个数据库上分别取得了97.33%和72.05%的识别率,与双重变换(TFT)方法和深时间嵌入网络(DTEN)方法相比,识别率分别至少提高了0.67和1.15个百分点。所提方法能进一步促进行为识别技术在安防、人机交互等领域的广泛应用。
    数据科学与技术
    基于有向无环图的倒排链等字长划分压缩算法
    姜琨, 刘征, 朱磊, 李晓星
    2021, 41(3):  727-732.  DOI: 10.11772/j.issn.1001-9081.2020060874
    摘要 ( )   PDF (905KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在搜索引擎的倒排索引等字长(FWA)类型压缩算法中,倒排链的“贪心”分块划分策略和码字信息的交错存储使算法难以达到最优的压缩效果。针对上述问题,提出了一种基于有向无环图(DAG)的FWA划分压缩算法。首先,考虑到互联网网页聚类特性带来的倒排链小数字信息,设计了一种数据区为64位分块的新型FWA压缩格式。该压缩格式通过4位的指示区将数据区划分为16种适合于连续小数字压缩的存储模式,并将倒排链每个分块的指示位和数据位分类存储,从而保证了较好的批量解压性能。其次,在新压缩格式的基础上提出一种基于DAG描述的倒排链FWA划分压缩方法——固定字对齐划分(WAP)算法。该算法利用DAG将倒排链分块划分问题归结为单源最短路径(SSSP)问题,并考虑FWA压缩格式中数据区存储模式的限制条件来确定SSSP问题的结构形式和递归定义。然后,给出了采用动态规划求解SSSP问题并形成最优划分向量的伪码和算法复杂度,并对S9、S16、S8b等传统FWA算法的原有存储模式进行了基于DAG的划分优化,把优化前后的算法的计算复杂度进行比较分析。最后,使用仿真整数序列数据和文本检索会议(TREC) GOV2网页索引数据进行压缩性能实验。实验结果表明,相较于传统FWA类型算法,基于DAG的FWA划分算法在通过批量解压和划分优化技术提升算法的压缩率和解压速度同时,对连续小数字整数序列进行压缩时能够获得比传统参照框架(FOR)类型算法更高的压缩率。
    基于k-means++的动态构建空间主题R树方法
    邹志文, 秦程
    2021, 41(3):  733-737.  DOI: 10.11772/j.issn.1001-9081.2020060851
    摘要 ( )   PDF (769KB) ( )  
    参考文献 | 相关文章 | 计量指标
    现有的R-树空间聚类技术在通常通过随机指定或者计算空间数据间的欧氏距离来选取聚类中心,而未考虑空间数据间的主题相关度。这些导致聚类结果受初始k值影响,空间数据间的关联仅仅是基于地理位置的。针对此种情况,提出了一种基于k-means++的动态构建空间主题R树(TR-tree)方法。首先,在传统的k-means++算法上,通过聚类测度函数动态地确定k个聚类簇,并在聚类测度函数中引入潜在狄利克雷分布(LDA)模型来计算每个空间数据文本的主题概率,从而加强空间数据间的主题关联度;其次,通过主题概率选取概率最大的聚类中心;最后,构建TR-tree,并且在构建时动态分配空间数据。实验结果表明:虽然构建R-树的时间略有增加,但该方法在索引效率及节点间关联度上较仅仅基于地理位置聚类构建R-树的算法有明显提升。
    自动确定聚类中心的比较密度峰值聚类算法
    郭佳, 韩李涛, 孙宪龙, 周丽娟
    2021, 41(3):  738-744.  DOI: 10.11772/j.issn.1001-9081.2020071071
    摘要 ( )   PDF (2809KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对密度峰值聚类算法(DPC)不能自动确定聚类中心,并且聚类中心点与非聚类中心点在决策图上的显示不够明显的问题,设计了一种自动确定聚类中心的比较密度峰值聚类算法(ACPC)。该算法首先利用距离的比较量来代替原距离参数,使潜在的聚类中心在决策图中更加突出;然后通过二维区间估计方法进行对聚类中心的自动选取,从而实现聚类过程的自动化。仿真实验结果表明,在4个合成数据集上ACPC取得了更好的聚类效果;而在真实数据集上的Accuracy指标对比表明,在Iris数据集上,ACPC聚类结果可达到94%,与传统的DPC算法相比提高了27.3%,ACPC解决了交互式选取聚类中心的问题。
    网络空间安全
    区块链在数据完整性保护领域的研究与应用进展
    高昊昱, 李雷孝, 林浩, 李杰, 邓丹, 李少旭
    2021, 41(3):  745-755.  DOI: 10.11772/j.issn.1001-9081.2020060912
    摘要 ( )   PDF (1658KB) ( )  
    参考文献 | 相关文章 | 计量指标
    数据作为一种现代信息社会不可或缺的新兴资源,从产生伊始就面临着被各方篡改的风险。遭到篡改的数据在可用性与真实性方面都会大打折扣。而区块链因其不可篡改、去中心化、防止单点故障的特性天然契合数据完整性保护的要求。首先,简述了区块链技术背景与数据保护的核心要求;其次,按照区块链类型将现有区块链数据完整性保护成果进行分类和介绍,并对各成果的优势与不足结合数据完整性保护进行总结;然后,将现有数据完整性保护技术分类并与区块链数据完整性保护技术进行比较,分析传统数据完整性保护技术的不足与区块链数据完整性保护技术的优势;最后,总结区块链数据完整性保护技术的不足之处,并给出解决思路。
    检测型的联盟区块链共识算法d-PBFT
    刘宇, 朱朝阳, 李金泽, 劳源基, 覃团发
    2021, 41(3):  756-762.  DOI: 10.11772/j.issn.1001-9081.2020060900
    摘要 ( )   PDF (1007KB) ( )  
    参考文献 | 相关文章 | 计量指标
    联盟区块链通常都会采用严格的身份准入机制,但然而该机制不能完全保证联盟网络中不会混入拜占庭恶意节点,也不能担保现有的联盟成员节点一定不会被第三方敌手劫持利用。针对这类问题,提出了一种能够监控节点状态的检测型实用拜占庭容错(d-PBFT)共识算法。首先,选举主节点并校验主节点的其状态,以保证选举出来的主节点从未有过作恶历史;然后,经历“预准备—准备—提交”的共识三阶段过程,尝试来完成客户端提交的共识请求;最后,会根据三阶段完成的情况对主节点的状态进行评估,将有故障或作恶行为的主节点标记出来,并将作恶的主节点加入到隔离区等待处理。该算法在容忍一定数量拜占庭节点的基础上还能随时监控各个节点的状态,并对恶意节点能够进行隔离,从而降低恶意节点对整个联盟系统的不良影响。实验结果表明,采用d-PBFT算法的网络拥有较高的吞吐量和较低的共识时延,并且在联盟网络中有拜占庭节点的情况下相较原实用拜占庭容错(PBFT)算法的共识生成量提升了26.1%。d-PBFT算法不仅提高了联盟网络的健壮性,还进一步提升了网络的吞吐量。
    基于sunflower的局部修复码构造
    张茂, 李瑞虎, 郑尤良, 付强
    2021, 41(3):  763-767.  DOI: 10.11772/j.issn.1001-9081.2020060839
    摘要 ( )   PDF (681KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前构造达到C-M界的二元局部修复码(LRC)的相关研究已经较为充分,但在一般域上还相对较少的问题,研究了一般域上LRC的构造。首先,提出了通过射影几何理论确定sunflower中元素个数的方法。其次,通过不相交局部修复组刻画LRC,从而清楚地描述LRC的码长、维数和局部度等参数。最后,在具有不相交局部修复组的校验矩阵的基础上,利用sunflower构造了两类一般域上最小距离为6的LRC,其中很多LRC是最优或拟最优的。相较于现有利用子域子码、广义级联码和代数曲线等方法构造的LRC,所构造得到的两类码在相同的码的最小距离和局部度下提升了信息率。这些结果说明所提方法可应用于一般域上其他LRC的构造。
    基于改进粒子群优化和极限学习机的网络安全态势预测
    唐延强, 李成海, 宋亚飞
    2021, 41(3):  768-773.  DOI: 10.11772/j.issn.1001-9081.2020060924
    摘要 ( )   PDF (1076KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对网络安全态势预测模型预测精度不高、收敛较慢等问题,提出了一种基于改进粒子群优化极限学习机(IPSO-ELM)算法的预测方法。首先,通过改进粒子群优化(PSO)算法中的惯性权重和学习因子来实现两种参数随着迭代次数增加的自适应调整,使PSO初期搜索范围大、速度高,后期收敛能力强、稳定。其次,针对PSO易陷入局部最优的问题,提出一种粒子停滞扰动策略,将陷入局部最优的粒子重新引导至全局最优飞行。改进粒子群优化(IPSO)算法既保证了全局寻优的能力,又对局部搜索能力有所增强。最后,将IPSO与极限学习机(ELM)结合来优化ELM的初始权值及阈值。与ELM相比,结合IPSO的ELM的预测精度提高了44.25%。实验结果表明,与PSO-ELM相比,IPSO-ELM的预测结果拟合度可达到0.99,收敛速度提升了47.43%。所提算法在预测精度和收敛速度等指标上明显优于对比算法。
    基于深度残差网络的语音隐写分析方法
    任奕茗, 王让定, 严迪群, 林昱臻
    2021, 41(3):  774-779.  DOI: 10.11772/j.issn.1001-9081.2020060763
    摘要 ( )   PDF (1026KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对目前以WAV格式语音为载体的最低有效位(LSB)隐写方法的检测性能较低的问题,提出了一种基于深度残差网络的语音隐写分析方法。首先,通过多组高通滤波器组成的固定卷积层来计算输入语音信号的残差信号,并利用截断线性激活单元对得到的残差信号进行截断操作;然后,通过卷积层与设计的残差块的堆叠来构建深度网络,以提取深层次的隐写特征数据;最后,利用全连接层与Softmax层组成的分类器输出最终的分类结果。实验结果表明,在Hide4PGP和LSBmatching两种隐写方法的不同密信嵌入率下,所提出模型的检测正确率都要优于现有的基于卷积神经网络(CNN)的隐写分析方法。对于0.1 bps嵌入率的Hide4PGP隐写方法,该隐写分析模型的检测正确率比LinNet提高了近7个百分点。
    基于感知哈希算法和特征融合的恶意代码检测方法
    姜倩玉, 王凤英, 贾立鹏
    2021, 41(3):  780-785.  DOI: 10.11772/j.issn.1001-9081.2020060906
    摘要 ( )   PDF (995KB) ( )  
    参考文献 | 相关文章 | 计量指标
    在当前的恶意代码家族检测中,通过恶意代码灰度图像提取的局部特征或全局特征无法全面描述恶意代码,针对这个问题并为提高检测效率,提出了一种基于感知哈希算法和特征融合的恶意代码检测方法。首先,通过感知哈希算法对恶意代码灰度图样本进行检测,快速划分出具体恶意代码家族和不确定恶意代码家族的样本,实验测试表明约有67%的恶意代码能够通过感知哈希算法检测出来。然后,对于不确定恶意代码家族样本再进一步提取局部特征局部二值模式(LBP)与全局特征Gist,并利用二者融合后的特征通过机器学习算法对恶意代码样本进行分类检测。最后,对于25类恶意代码家族检测的实验结果表明,相较于仅用单一特征,使用LBP与Gist的融合特征时的检测准确率更高,并且所提方法与仅采用机器学习的检测算法相比分类检测效率更高,检测速度提高了93.5%。
    先进计算
    基于稳定匹配的多用户任务卸载策略
    毛莺池, 徐雪松, 刘鹏飞
    2021, 41(3):  786-793.  DOI: 10.11772/j.issn.1001-9081.2020060861
    摘要 ( )   PDF (1162KB) ( )  
    参考文献 | 相关文章 | 计量指标
    随着许多计算密集型应用的出现,移动设备因其有限的计算能力无法满足用户时延、能耗等需求。移动边缘计算(MEC)通过无线信道将用户的任务计算卸载到MEC服务器,从而显著减少任务响应时延和能耗。针对多用户任务卸载问题,提出了基于稳定匹配的多用户任务卸载策略(MUTOSA),在保证用户的时延要求下达到能耗最小化。首先,在综合考虑时延与能耗的基础上,对独立任务场景下的多用户任务卸载问题进行建模;然后,基于博弈论的稳定匹配中的延迟接收思想,提出了一种调整策略;最后,通过不断迭代,解决了多用户任务卸载问题。实验结果表明,该策略相较于基准策略和启发式策略能够满足更多用户的时延要求,平均提高约10%的用户满意度,并能减少约50%的用户设备总能耗。所提策略在保证用户时延要求的同时有效地减少了能耗,可以有效地提高用户对于时延敏感型应用的体验。
    考虑空间众包工作者服务质量的任务分配策略及其萤火虫群优化算法求解
    冉家敏, 倪志伟, 彭鹏, 朱旭辉
    2021, 41(3):  794-802.  DOI: 10.11772/j.issn.1001-9081.2020060940
    摘要 ( )   PDF (1196KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对空间众包中的任务分配问题,考虑空间众包工作者的服务质量对分配结果的影响,从而提出了一种加入了工作者服务质量评价的任务分配策略。首先,在每个时空环境下,加入工作者的评价要素以建立充分考虑工作者服务质量和距离成本的多目标模型;其次,通过改进离散型萤火虫群优化算法的初始化及编码策略、位置移动策略、邻域搜索策略使算法收敛速度加快、全局寻优能力提高;最后,利用改进后的算法来求解模型。在模拟和真实数据集上的实验结果表明,该算法在不同规模数据集上较其他群智能算法可提高2%~25%的任务分配总得分。该算法考虑了工作者的服务质量后,可有效提高任务分配效率和最终总得分。
    求解多目标社区发现问题的离散化随机漂移粒子群优化算法
    李萍, 汪芬, 陈祺东, 孙俊
    2021, 41(3):  803-811.  DOI: 10.11772/j.issn.1001-9081.2020060800
    摘要 ( )   PDF (1095KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对求解复杂网络的多目标社区发现问题,提出了一种离散化随机漂移粒子群优化(DRDPSO)算法。首先,通过对社区进行随机化编码操作和针对随机漂移算法的离散化操作,来改善局部网络结构并逐渐增强全局模块度值;其次,根据核K均值(KKM)和比例割(RC)两个目标函数来控制网络中的社区规模、缓解模块度分辨率限制;最后,根据多目标求解策略逐步更新Pareto非劣解集,从Pareto非劣解集选取满足需求的目标社区结构。为了验证所提算法的有效性,将DRDPSO算法与其他社区发现算法在三种具有10个不同参数设置的生成网络及三种真实网络上进行对比实验,并采用两个最佳社区评价指标对各算法获得的社区发现结果进行对比分析。实验结果表明,使用DRDPSO算法求解复杂网络的多目标社区发现问题时,获得的社区发现评价指标(归一化互信息和模块度)最高的概率达到95%以上。可见DRDPSO算法在真实网络进行应用能进一步地提高网络社区划分的精确度和鲁棒性。
    面向卷积神经网络的高并行度FPGA加速器设计
    王晓峰, 蒋彭龙, 周辉, 赵雄波
    2021, 41(3):  812-819.  DOI: 10.11772/j.issn.1001-9081.2020060996
    摘要 ( )   PDF (1115KB) ( )  
    参考文献 | 相关文章 | 计量指标
    大多数基于卷积神经网络(CNN)的算法都是计算密集型和存储密集型的,很难应用于具有低功耗要求的航天、移动机器人、智能手机等嵌入式领域。针对这一问题,提出一种面向CNN的高并行度现场可编程逻辑门阵列(FPGA)加速器。首先,比较研究CNN算法中可用于FPGA加速的4类并行度;然后,提出多通道卷积旋转寄存流水(MCRP)结构,简洁有效地利用了CNN算法的卷积核内并行;最后,采用输入输出通道并行+卷积核内并行的方案提出一种基于MCRP结构的高并行度CNN加速器架构,并将其部署到XILINX的XCZU9EG芯片上,在充分利用片上数字信号处理器(DPS)资源的情况下,峰值算力达到2 304 GOPS。以SSD-300算法为测试对象,该CNN加速器的实际算力为1 830.33 GOPS,硬件利用率达79.44%。实验结果表明,MCRP结构可有效提高CNN加速器的算力,基于MCRP结构的CNN加速器可基本满足嵌入式领域大部分应用的算力需求。
    网络与通信
    基于时间反演的到达时间定位
    张齐林, 李方伟, 王明月
    2021, 41(3):  820-824.  DOI: 10.11772/j.issn.1001-9081.2020060976
    摘要 ( )   PDF (950KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对传统算法在室内超宽带(UWB)到达时间(TOA)定位系统里很难准确搜寻出第一条直射路径,从而导致定位精度不高的问题,提出了基于时间反演(TR)的TOA室内UWB定位算法。首先,利用TR处理的空时聚焦特性确定第一条直射路径,从而估计这条路径的TOA;其次,通过加权最小二乘(WLS)定位算法对不同的估计分量赋予相应的权值以提高定位精度。仿真结果表明,相较传统TOA定位,所提方案在低信噪比条件下的均方根误差(RMSE)减小了28.6%,可见该方案有效提升了系统定位精度。
    基于前向纠错的自适应网络传输机制
    祝永晋, 尹飞, 豆龙龙, 吴昆, 张志伟, 钱柱中
    2021, 41(3):  825-832.  DOI: 10.11772/j.issn.1001-9081.2020060948
    摘要 ( )   PDF (1133KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对无线网络中的传输控制协议(TCP)因为丢包触发丢包重传机制而导致传输性能大幅下降的问题,提出了一种基于前向纠错的自适应传输机制(AdaptiveFEC)。该机制通过前向纠错来减少数据段的丢失,以避免触发TCP的丢包重传机制,从而达到提升TCP传输性能的目的。首先,根据当前的网络状况以及当前连接的数据传输特征确定当前时间段中的最优冗余段比例;然后,利用TCP数据段中的数据段序号信息实时进行网络状况的估计,从而根据网络波动来动态更新冗余段比例。大量实验结果说明,在20 ms的往返时延以及5%丢包率的传输环境中,相较于静态的前向纠错机制,AdaptiveFEC能够使得TCP连接的传输速率平均提升42%,当运用在文件下载的应用中时,所提机制能够使得下载速度提升至原来的两倍。
    多媒体计算与计算机仿真
    基于增强现实的手术导航系统快速标定算法
    孙启昌, 麦永锋, 陈晓军
    2021, 41(3):  833-838.  DOI: 10.11772/j.issn.1001-9081.2020060776
    摘要 ( )   PDF (1272KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对光学半透式头戴显示器(OST-HMD)在增强现实(AR)中的虚实融合问题,提出了一种基于光学定位跟踪系统的OST-HMD快速标定算法。首先,通过把OST-HMD中的虚拟标记点和其在真实世界中的对应点组成两个三维点集,对虚拟空间到光学定位追踪空间之间的映射进行估计,从而求解虚拟空间到真实场景的转换矩阵。然后,建立整个导航系统的矩阵传递关系,在此基础上设计并实现了基于AR的手术导航系统,并对其进行了精度验证实验和模型实验。实验结果表明,所提算法使虚拟基准点和对应的真实基准点之间的均方根误差达到1.39 ±0.49 mm,标定过程的平均耗时为23.8 s,证明该算法具有临床应用的潜力。
    基于双相机捕获面部表情及人体姿态生成三维虚拟人动画
    刘洁, 李毅, 朱江平
    2021, 41(3):  839-844.  DOI: 10.11772/j.issn.1001-9081.2020060993
    摘要 ( )   PDF (1377KB) ( )  
    参考文献 | 相关文章 | 计量指标
    为了生成表情丰富、动作流畅的三维虚拟人动画,提出了一种基于双相机同步捕获面部表情及人体姿态生成三维虚拟人动画的方法。首先,采用传输控制协议(TCP)网络时间戳方法实现双相机时间同步,采用张正友标定法实现双相机空间同步。然后,利用双相机分别采集面部表情和人体姿态。采集面部表情时,提取图像的2D特征点,利用这些2D特征点回归计算得到面部行为编码系统(FACS)面部行为单元,为实现表情动画做准备;以标准头部3D坐标值为基准,根据相机内参,采用高效n点投影(EPnP)算法实现头部姿态估计;之后将面部表情信息和头部姿态估计信息进行匹配。采集人体姿态时,利用遮挡鲁棒姿势图(ORPM)方法计算人体姿态,输出每个骨骼点位置、旋转角度等数据。最后,在虚幻引擎4(UE4)中使用建立的虚拟人体三维模型来展示数据驱动动画的效果。实验结果表明,该方法能够同步捕获面部表情及人体姿态,而且在实验测试中的帧率达到20 fps,能实时生成自然真实的三维动画。
    基于注意力机制的图像超分辨率重建
    王永金, 左羽, 吴恋, 崔忠伟, 赵晨洁
    2021, 41(3):  845-850.  DOI: 10.11772/j.issn.1001-9081.2020060979
    摘要 ( )   PDF (2394KB) ( )  
    参考文献 | 相关文章 | 计量指标
    目前,单幅图像超分辨率重建取得了很好的效果,然而大多数模型都是通过增加网络层数来达到好的效果,并没有去发掘各通道之间的相关性。针对上述问题,提出了一种基于通道注意力机制(CA)和深度可分离卷积(DSC)的图像超分辨率重建方法。整个模型采用多路径模式的全局和局部残差学习,首先利用浅层特征提取块来提取输入图像的特征;然后,在深层特征提取块中引入通道注意力机制,通过调整各通道的特征图权重来增加通道相关性,从而提取高频特征信息;最后,重建出高分辨率图像。为了减少注意力机制带来的巨大参数影响,在局部残差块中使用了深度可分离卷积技术以大大减少训练参数,同时采用自适应矩估计(Adam)优化器来加速模型的收敛,从而提高了算法性能。该方法在Set5、Set14数据集上进行图像重建,实验结果表明不仅该方法重建的图像具有更高的峰值信噪比(PSNR)和结构相似度(SSIM),而且所提模型的参数量减少为深度残差通道注意力网络(RCAN)模型的参数量的1/26。
    前沿与综合应用
    模糊需求下低碳取送货车辆调度问题与算法
    马艳芳, 王珊, 黄岭玉, 程聪
    2021, 41(3):  851-859.  DOI: 10.11772/j.issn.1001-9081.2020071079
    摘要 ( )   PDF (1198KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对物流配送过程中的高碳排放问题,从低碳视角出发,构建考虑模糊需求的低碳取送货车辆调度(LCVRPPD)模型,并提出一种基于2-OPT的差分算法对问题进行求解。该算法中,采用自然数编码方式并设置三种不同的适应度函数;随后,引入2-OPT算法取代差分算法原有的变异机制,并结合二项交叉算子和贪婪选择算子,从而提高改进算法的收敛速度。案例分析中,通过田口法确定改进算法参数的合理取值,通过SPSS分析揭示了在运输成本最小、碳排放量最小和总成本最小的三种不同目标模型中,以总成本最小为目标函数的模型的解的效果最好。针对不同顾客规模的算例,改进算法与基本差分算法相比,总成本可以降低1.8%~3.0%,碳排放量可以降低0.7%~3.5%;与遗传算法相比,总成本可以降低1.9%~16.47%,碳排放量可以降低1.2%~4.3%;与粒子群优化算法相比的优化效果更加明显,总成本可以降低4.0%~22.5%,碳排放量可以降低1.56%~7.88%,验证了算法的有效性及先进性。综上,所提出的模型和算法可以为低碳取送货车辆调度问题提供参考。
    基于改进遗传算法的标签印刷生产调度技术
    马晓梅, 何非
    2021, 41(3):  860-866.  DOI: 10.11772/j.issn.1001-9081.2020060833
    摘要 ( )   PDF (1167KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对标签印刷生产过程中存在的多品种、小批量、客户定制化程度高、部分生产工序存在不确定性等问题建立了以最小化最大完工时间为目标的柔性作业车间调度模型,提出了一种改进遗传算法(GA)。首先,在标准遗传算法的基础上采用整数编码;然后,在选择操作阶段采用轮盘赌法,并通过引入精英解保留策略以确保算法收敛性;最后,提出动态自适应交叉和变异概率,从而保证算法在前期进行较大范围寻优,以避免早熟,而后期尽快收敛,以保证前期获得的优良个体不被破坏。为了验证所提改进遗传算法的可行性,首先采用Ft06基准算例把所提算法与标准遗传算法(GA)进行比较,结果显示改进遗传算法的最优解(55 s)优于标准遗传算法的最优解(56 s),且改进遗传算法的迭代次数明显优于标准遗传算法;然后通过柔性作业车间调度问题(FJSP)的8×8、10×10和15×10标准算例进一步验证了算法的稳定性和寻优性能,在3个标准测试算例上改进遗传算法均在较短时间内取得了最优解;最后,将该算法用于求解标签印刷车间的排产问题时,使得加工效率比原来提高了50.3%。因此,提出的改进遗传算法可以有效应用于求解标签印刷车间的排产问题。
    基于博弈论的散货港口堆场堆位分配算法
    张舒瑶, 李勇华, 范家佳
    2021, 41(3):  867-874.  DOI: 10.11772/j.issn.1001-9081.2020060911
    摘要 ( )   PDF (1307KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对散货港口因堆场面积有限,在货物进港作业时,如何在进出港货物动态变化的情况下兼顾作业效率并安排货物在堆场中合理堆放的问题,提出了一种基于博弈论的散货港口堆场堆位分配算法(BSAABG)。首先,将堆位分配行为建模为动态博弈,并运用满足均衡分析该博弈。假设每票货物对分配所得效益都有一个预期,当所有货物都达到预期时博弈即达到满足均衡。然后,使用基于博弈论的散货堆场堆位分配算法BSAABG求解之前建立的该模型,从理论上证明算法的收敛性。实验结果表明,当货物票数为20时,基于博弈论的散货堆场堆位分配算法BSAABG的货物平均满足度比人工分配方法(用贪心算法(GA)模拟)和基于规则的堆位分配算法(SABR)分别提高了62.5%和18.2%,堆场分配效益是贪心算法(GA)的6.83倍,是SABR的3.22倍。可见所提算法能够有效地提高货物的平均满足度和堆场分配效益。
    基于时空特征向量的长短期记忆人工神经网络的城市公交旅行时间预测
    张欣环, 刘宏杰, 施俊庆, 毛程远, 孟国连
    2021, 41(3):  875-880.  DOI: 10.11772/j.issn.1001-9081.2020060467
    摘要 ( )   PDF (859KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对“随着预测距离的增加,旅行时间预测的难度加大”的问题,提出了一种基于时空特征向量的长短期记忆(LSTM)和人工神经网络(ANN)的综合预测模型。首先,将24 h切分为288个时间切片,以生成时间特征向量;然后,基于时间切片建立LSTM时间窗口模型,该模型可解决长期预测的窗口移动问题;其次,将公交线路切分为多个空间切片,并使用当前空间切片的共同平均速度作为瞬时速度,同时将每个空间切片的预测时间用作空间特征向量,并将其发送到新型的混合神经网络模型LSTM-A中,该模型结合两种预测模型的优点并解决了公交旅行时间预测问题;最后,基于实验数据集进行了实验和测试:将公交站点间的预测问题划分为线路切片预测子问题,并针对每个相关的子问题引入了实时计算的概念,从而避免了复杂路况带来的预测误差。实验结果表明,所提算法在准确性、适用性方面均优于单个神经网络模型。综上,所提的新型混合神经网络模型LSTM-A能从时间特征的维度实现长距离到站预测、从空间特征的维度实现短距离到站预测,从而有效地解决了城市公交旅行时间预测问题,避免了公交车辆的远程依赖和错误积累。
    基于旅行商问题转化和遗传算法求解汽配件喷涂顺序
    王彬溶, 谭代伦, 郑伯川
    2021, 41(3):  881-886.  DOI: 10.11772/j.issn.1001-9081.2020060868
    摘要 ( )   PDF (970KB) ( )  
    参考文献 | 相关文章 | 计量指标
    对汽配件颜色喷涂顺序进行优化有助于企业进一步降低生产成本,而目前尚无研究对该类问题提出针对性的数学模型和解法。考虑到每一个汽配件必须喷涂且只喷涂一次,具有旅行商问题(TSP)的基本特征,为此提出了TSP转化的建模方法并选用并行性和鲁棒性强的遗传算法(GA)进行求解。首先,将汽配件定义为TSP顶点,根据汽配件的颜色和类别要求定义顶点之间的距离和生产约束条件,以此构建了使喷涂序列颜色切换次数最少的0-1规划模型。其次,将汽配件的颜色和类别约束转化为惩罚因子,从而构成遗传算法的适应度函数,并基于锦标赛选择策略综合设计了复制、交换、翻转、滑动的变异策略。最后,构造汽配件数为64、93、293个,颜色数为5、7、10种的三组数据进行仿真实验,所提算法对这三组数据均能求得精确最优解5,7,10,而重复运行算法,可以获得近似最优解的均值分别为5.63,7.30,11.49。实验结果表明所建立的数学模型对汽配件颜色喷涂顺序问题的刻画准确,设计的遗传算法高效实用,此二者可推广应用于其他类似的生产加工问题。
    基于堆叠分类器的心电异常监测模型设计
    秦静, 左长青, 汪祖民, 季长清, 王宝凤
    2021, 41(3):  887-890.  DOI: 10.11772/j.issn.1001-9081.2020060760
    摘要 ( )   PDF (765KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对传统的人工监测心脏疾病的方法对资深医生的依赖性强,需要一定的先验知识,且其监测疾病的速度和准确性有待提高等问题,提出了一种基于堆叠分类器的心电(ECG)监测算法来用于心脏异常的判定。首先,将多种机器学习算法的优势相结合,通过叠加分类器的方式集成起来,从而弥补了单个机器学习算法学习的局限性;其次,使用合成少数过采样技术(SMOTE)对原有的数据集进行了数据扩充,使得各种疾病的数量持平从而增强数据的平衡性。通过在MIT-BIH数据集上与其他机器学习算法的结果进行比较评估,实验结果表明所提算法能够提高ECG异常监测的准确性。
    基于特征融合和动态多尺度空洞卷积的超声甲状腺分割网络
    胡屹杉, 秦品乐, 曾建潮, 柴锐, 王丽芳
    2021, 41(3):  891-897.  DOI: 10.11772/j.issn.1001-9081.2020060783
    摘要 ( )   PDF (1326KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对甲状腺超声影像中甲状腺组织大小和形态的多样性以及周边组织的复杂性,提出了一种基于特征融合和动态多尺度空洞卷积的超声甲状腺分割网络。首先,利用不同膨胀率的空洞卷积和动态滤波器来融合不同感受野下的全局语义特征与不同范围的上下文详情的语义特征,从而提升网络对多尺度目标的适应性与准确度;然后,在特征降维时采用混合上采样方式,以增强高维语义特征的空间信息和低维空间特征的上下文信息;最后,采用空间注意力机制来优化图像的低维特征,并采用高低维特征融合的方式使高低维特征信息在保留重要特征的同时摒弃冗余信息以及使网络对于图像前背景的区分能力得到增强。实验结果表明,所提方法在甲状腺超声影像公开数据集上达到了0.963±0.026的准确率、0.84±0.03的召回率和0.79±0.03的dice系数。可见所提方法能较好地解决组织形态差异性大以及周边组织复杂的问题。
    基于迁移孪生非负矩阵分解的静脉识别算法
    王锦凯, 贾旭
    2021, 41(3):  898-903.  DOI: 10.11772/j.issn.1001-9081.2020060965
    摘要 ( )   PDF (944KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对某一静脉图像数据集下获得的识别算法对于其他数据集缺少普适性的问题,提出了一种具有迁移性的孪生非负矩阵分解(NMF)模型。首先,通过采用两个结构相同且参数共享的NMF模型实现了对源数据集中带有相同标签静脉图像的有监督学习;然后,通过使用最大均值差异约束降低了不同数据集之间静脉特征的差异性,即将源数据集中的知识迁移至目标数据集中;最后,基于余弦距离实现静脉图像的匹配。实验结果表明,所提的识别算法不仅可以在源数据集下上获得较高的正确识别率,而且仅利用目标数据集中的少量静脉图像便可使得在目标数据集上的平均错误接受率(FAR)与平均错误拒绝率(FRR)分别降低至0.043与0.055。此外,所提算法平均0.56 s的识别时间可以满足识别的实时性要求。
    基于改进Faster R-CNN的钢轨踏面块状伤损检测方法
    罗晖, 贾晨, 芦春雨, 李健
    2021, 41(3):  904-910.  DOI: 10.11772/j.issn.1001-9081.2020060759
    摘要 ( )   PDF (1562KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对钢轨踏面块状伤损存在的尺度变化大、样本数据集小的问题,提出了基于改进Faster R-CNN的钢轨踏面块状伤损检测方法。首先,基于ResNet-101基础网络结构来构建多尺度特征金字塔(FPN),以实现深、浅层特征信息的融合,从而提高了小尺度伤损的检测精度;然后,采用广义交并比(GIoU)损失解决了Faster R-CNN中回归损失SmoothL1对预测边框位置不敏感问题;最后,提出引导锚定的区域提名网络(GA-RPN)方法,从而解决了区域生成网络(RPN)生成的锚点大量冗余而导致的检测网络训练中正负样本失衡问题。训练过程中,基于翻转、裁剪、噪声扰动等图像预处理方法对RSSDs数据集进行扩充,解决了钢轨踏面块状伤损训练样本不充足问题。实验结果表明,所提改进方法对钢轨踏面块状伤损检测的平均精度均值(mAP)可达到82.466%,相较于Faster R-CNN提高了13.201个百分点,能够更加准确地检测钢轨踏面块状伤损。
    结合图像增强和卷积神经网络的小麦不完善粒识别
    贺杰安, 吴晓红, 何小海, 胡建蓉, 卿粼波
    2021, 41(3):  911-916.  DOI: 10.11772/j.issn.1001-9081.2020060864
    摘要 ( )   PDF (1123KB) ( )  
    参考文献 | 相关文章 | 计量指标
    针对实际应用场景下,小麦籽粒图像背景单一以及小麦不完善粒的不完善特征大多是局部特征而大部分图像特征与正常粒无异的特点,提出一种基于细节的图像增强(IE)的小麦不完善粒识别方法。首先,使用交替最小化算法约束原图在水平方向和竖直方向的L0范数来平滑原图作为基础图层,并用原图减去基础图层得到图像的细节层;然后,突出细节层后将其与基础图层叠加以增强图像;最后,将增强后的图像作为卷积神经网络(CNN)的输入,使用加入了批正则化(BN)层的CNN对图像进行识别。分别以经典分类网络LeNet-5、ResNet-34、VGG-16和在其中添加BN层的这些网络作为分类网络,增强前后的图像作为输入来进行分类实验,并以测试集准确率评估性能。实验结果表明,三个经典分类网络均在添加了BN层后而使用相同输入时的测试集准确率提高了5个百分点,在使用细节增强后的图像作为输入时三个网络的测试集准确率提高了1个百分点,以上二者联合使用时三个网络均获得超过7个百分点的测试集准确率提升。
2022年 42卷 1期
刊出日期: 2022-01-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:成都市武侯区人民南路四段9号
   中国科学院成都分院
   《计算机应用》编辑部(610041)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会