栏目文章信息

    2021年中国计算机学会人工智能会议(CCFAI 2021) 栏目所有文章列表
    (按年度、期号倒序)
        一年内发表的文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 融合多粒度社区信息的网络嵌入方法
    胡军, 许正康, 刘立, 钟福金
    《计算机应用》唯一官方网站    2022, 42 (3): 663-670.   DOI: 10.11772/j.issn.1001-9081.2021040790
    摘要466)   HTML60)    PDF (758KB)(275)    收藏

    现有大多数网络嵌入方法仅保留了网络的局部结构信息,而忽略了网络中的其他潜在信息。为了保留网络的社区信息,并体现网络社区结构的多粒度特性,提出一种融合多粒度社区信息的网络嵌入方法(EMGC)。首先,获得网络的多粒度社区结构,并初始化节点嵌入和社区嵌入;然后,根据上一粒度上的节点嵌入和本层粒度的社区结构,更新社区嵌入,进而调整相应的节点嵌入;最后,对不同粒度下的节点嵌入进行拼接,从而得到融合多粒度社区信息的网络嵌入结果。在4个真实网络数据集上进行实验,相较于未考虑社区信息的方法(DeepWalk、node2vec)和考虑了单一粒度社区信息的方法(ComE、GEMSEC),EMGC在链接预测上的AUC值和节点分类上的F1值总体上优于对比方法。实验结果表明EMGC能够有效提升后续链接预测和节点分类的准确率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    2. 基于先验知识的非负矩阵半可解释三因子分解算法
    陈露, 张晓霞, 于洪
    《计算机应用》唯一官方网站    2022, 42 (3): 671-675.   DOI: 10.11772/j.issn.1001-9081.2021040927
    摘要442)   HTML26)    PDF (600KB)(232)    收藏

    非负矩阵三因子分解是潜在因子模型中的重要组成部分,由于能将原始数据矩阵分解为三个相互约束的潜因子矩阵,被广泛应用于推荐系统、迁移学习等研究领域,但目前还没有非负矩阵三因子分解的可解释性方面的研究工作。鉴于此,将用户评论文本信息当作先验知识,设计了一种基于先验知识的非负矩阵半可解释三因子分解(PE-NMTF)算法。首先利用情感分析技术提取用户评论文本信息的情感极性偏好;然后更改了非负矩阵三因子分解算法的目标函数和更新公式,巧妙地将先验知识嵌入到算法中;最后在推荐系统冷启动任务的Yelp和Amazon数据集以及图像零次识别任务的AwA和CUB数据集上与非负矩阵分解、非负矩阵三因子分解算法做了大量对比实验,实验结果表明所提算法在均方根误差(RMSE)、归一化折损累计增益(NDCG)、归一化互信息(NMI)和准确率(ACC)上都表现优异,且利用先验知识进行非负矩阵三因子分解的解释具有可行性和有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    3. 基于随机素描方法的在线核回归
    刘清华, 廖士中
    《计算机应用》唯一官方网站    2022, 42 (3): 676-682.   DOI: 10.11772/j.issn.1001-9081.2021040869
    摘要259)   HTML19)    PDF (628KB)(91)    收藏

    在线核回归学习中,每当一个新的样本到来,训练器都需要计算核矩阵的逆矩阵,这个过程的计算复杂度至少为关于回合数的平方级别。提出将素描方法应用于假设的更新,给出一个基于素描方法的更高效的在线核回归算法。首先,将损失函数设定为平方损失,应用Nystr?m近似方法来近似核,并借鉴跟导方法(FTL)的思想,提出一个新的梯度下降算法,称之为FTL-在线核回归(F-OKR);然后,应用素描方法对其加速,使得F-OKR的计算复杂度降低到关于回合数和素描规模线性、关于数据维度平方的级别;最后,设计了一个高效的素描在线核回归算法(SOKR)。与F-OKR相比,SOKR的精度几乎没有影响,而同时在适当的数据集上,运行时间减少16.7%左右。在理论上证得了两种算法的亚线性后悔界。实验结果也验证了所提算法与Nystr?m在线梯度下降算法(NOGD)相比有更好的表现,平均损失降低约64%。

    图表 | 参考文献 | 相关文章 | 多维度评价
    4. 双重特征加权模糊支持向量机
    邱云志, 汪廷华, 戴小路
    《计算机应用》唯一官方网站    2022, 42 (3): 683-687.   DOI: 10.11772/j.issn.1001-9081.2021040760
    摘要303)   HTML15)    PDF (434KB)(98)    收藏

    针对当前基于特征加权的模糊支持向量机(FSVM)只考虑特征权重对隶属度函数的影响,而没有考虑在样本训练过程中将特征权重应用到核函数计算中的缺陷,提出了同时考虑特征加权对隶属度函数和核函数计算的影响的模糊支持向量机算法——双重特征加权模糊支持向量机(DFW-FSVM)。首先,利用信息增益(IG)计算出每个特征的权重;然后,在原始空间中基于特征权重计算出样本到类中心的加权欧氏距离,进而应用该加权欧氏距离构造隶属度函数,并在样本训练过程中将特征权重应用到核函数的计算中;最后,根据加权的隶属度函数和核函数构造出DFW-FSVM算法。该方法避免了在计算过程中被弱相关或不相关的特征所支配。在8个UCI数据集上进行对比实验,结果显示DFW-FSVM算法的准确率和F1值较5个对比算法(SVM、FSVM、特征加权SVM(FWSVM)、特征加权FSVM(FWFSVM)、基于中心核对齐的FSVM(CKA-FSVM))中的最好结果分别提升了2.33和5.07个百分点,具有较好的分类性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    5. 基于ReliefF的层次分类在线流特征选择算法
    张小清, 王晨曦, 吕彦, 林耀进
    《计算机应用》唯一官方网站    2022, 42 (3): 688-694.   DOI: 10.11772/j.issn.1001-9081.2021040789
    摘要365)   HTML12)    PDF (860KB)(144)    收藏

    在图像标注、疾病诊断等实际分类任务中,数据标记空间的类别通常存在着层次化结构关系,且伴随着特征的高维性。许多层次特征选择算法因不同的实际任务需求而提出,但这些已有的特征选择算法忽略了特征空间的未知性和不确定性。针对上述问题,提出一种基于ReliefF的面向层次分类学习的在线流特征选择算法OH_ReliefF。首先将类别之间的层次关系融入ReliefF算法中,定义一种新的面向层次化数据的特征权重计算算法HF_ReliefF;其次,利用特征对决策属性的划分能力动态选择重要特征;最后,基于特征之间的独立性对特征进行动态冗余分析。实验结果表明,与五种先进的在线流特征选择算法作对比,OH_ReliefF算法在K最邻近(KNN)分类器和拉格朗日支持向量机(LSVM)分类器的各个评价指标中都取得较优的结果,准确率最少提高7个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    6. 混合伊藤算法求解多尺度着色旅行商问题
    韩舒宁, 徐敏, 董学士, 林青, 沈凡凡
    《计算机应用》唯一官方网站    2022, 42 (3): 695-700.   DOI: 10.11772/j.issn.1001-9081.2021040776
    摘要268)   HTML11)    PDF (474KB)(93)    收藏

    着色旅行商问题(CTSP)是多旅行商问题(MTSP)与旅行商问题(TSP)的一种扩展,主要应用于含重复区域的多机工程系统(MES)等工程问题。CTSP是NP完全问题,尽管相关研究尝试采用遗传算法(GA)、模拟退火(SA)等方法求解该问题,但它们求解的问题尺度有限,且速度和求解质量上不尽人意。基于此,尝试采用一种基于均匀设计(UD)融合蚁群(ACO)算法和伊藤算法(IT?)的混合伊藤算法(UDHIT?)来求解该问题。UDHIT?采用UD来选择合适的参数组合,借助ACO的概率图模型来产生可行解,并利用伊藤算法的漂移和波动算子进行优化。实验的结果表明,UDHIT?求解多尺度CTSP的最优解和平均解比传统GA、ACO和IT?有所改善。

    图表 | 参考文献 | 相关文章 | 多维度评价
    7. 基于基因交换的自适应人工鱼群算法
    李宗正, 周恺卿, 欧云, 丁雷
    《计算机应用》唯一官方网站    2022, 42 (3): 701-707.   DOI: 10.11772/j.issn.1001-9081.2021040775
    摘要329)   HTML23)    PDF (571KB)(111)    收藏

    针对人工鱼群算法(AFSA)不能完美地平衡局部寻优与全局寻优,且缺乏跳出局部最优能力等问题,提出了一种基于基因交换的自适应人工鱼群算法(AAFSA-GE)。首先利用自适应的视野和步长提高搜索的速度及精度,然后利用混乱行为和基因交换行为增强跳出局部最优的能力并提高搜索效率。为了证明算法的有效性,在实验中使用了10种经典的测试函数将所提算法与规范鱼群算法(NFSA)、基于扩展记忆粒子群优化算法的人工鱼群算法(PSOEM-FSA)、综合改进人工鱼群算法(CIAFSA)等改进鱼群算法进行了比较。实验结果表明,AAFSA-GE较PSOEM-FSA、CIAFSA具有更优秀局部寻优能力和全局寻优能力,较NFSA具有更高的搜索效率以及更好的全局寻优能力。

    图表 | 参考文献 | 相关文章 | 多维度评价
    8. 基于贝叶斯权函数的模型无关元学习算法
    许仁杰, 刘宝弟, 张凯, 刘伟锋
    《计算机应用》唯一官方网站    2022, 42 (3): 708-712.   DOI: 10.11772/j.issn.1001-9081.2021040758
    摘要359)   HTML11)    PDF (466KB)(129)    收藏

    模型无关的元学习(MAML)是一种多任务的元学习算法,能使用不同的模型,并快速地在不同任务之间进行适应,但MAML在训练速度与准确率上还亟待提高。从高斯随机过程的角度出发对MAML的原理进行分析,提出一种基于贝叶斯权函数的模型无关元学习(BW-MAML)算法,该权函数利用贝叶斯分析设计并用于损失的加权。训练过程中,BW-MAML将每次抽样的任务视为遵循高斯分布,根据贝叶斯分析计算不同任务在分布中的概率,并根据任务在分布中的概率判断该任务重要程度,再以此赋以不同的权重,从而提高每次梯度下降中信息的利用率。在Omniglot与Mini-ImageNet数据集上的小样本图像学习实验结果表明,通过增加贝叶斯权函数,BW-MAML的训练效果在6任务训练2 500步后,在Mini-ImageNet上的准确率比MAML的准确率最高提高了1.9个百分点,并且最终准确率比MAML平均提升了0.907个百分点;在Omniglot上的准确率也平均提升了0.199个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    9. 基于离散哈希的聚类
    轩书婷, 刘惊雷
    《计算机应用》唯一官方网站    2022, 42 (3): 713-723.   DOI: 10.11772/j.issn.1001-9081.2021040911
    摘要243)   HTML8)    PDF (1072KB)(133)    收藏

    传统的聚类方法是在数据空间进行,且聚类数据的维度较高。为了解决这两个问题,提出了一种新的二进制图像聚类方法——基于离散哈希的聚类(CDH)。该框架通过 L 21 范数实现自适应的特征选择,从而降低数据的维度;同时通过哈希方法将数据映射到二进制的汉明空间,随后,在汉明空间中对稀疏的二进制矩阵进行低秩矩阵分解,完成图像的快速聚类;最后使用可以快速收敛的优化方案来对目标函数进行优化求解。在Caltech101、Yale、COIL20、ORL图像数据集上的实验结果表明,该方法可以有效提升聚类效率。在Caltech101数据集的Gabor视图,与传统的K-means、谱聚类方法相比,在处理高维度数据时,CDH的时间效率分别提高了约87和98个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    10. 基于时间条件提取序列的数据流偏好查询
    李润泽, 孙雪姣
    《计算机应用》唯一官方网站    2022, 42 (3): 724-730.   DOI: 10.11772/j.issn.1001-9081.2021040786
    摘要227)   HTML10)    PDF (635KB)(53)    收藏

    传统关于偏好推理、偏好查询的研究主要集中在对关系元组表示的单个对象的偏好上,而将时间条件偏好查询的方法扩展到数据流的提取序列中是一个挑战,遇到的问题主要包括对数据流中序列的提取、快速处理以得到占优序列和占优对象等。针对偏好数据流,首先,扩展了连续查询语言(CQL),提出专门为有效处理数据流上的时间条件偏好的查询语言StreamSeq,它允许对数据流中提取的序列进行时间条件偏好规范和推理;然后,设计了从数据流中按时间索引提取对象序列的算法和执行序列间占优对比的算法,根据输入的数据流返回满足偏好条件的占优序列;最后,使用两组数据集进行实验验证。在合成数据集上,当属性数、序列数、时间范围和时间滑动间隔为10、8、20 s、1 s时,提取序列算法和CQL等效算法的运行时间加速比为13.33;在真实数据集上,当时间范围和时间滑动间隔为40 s、1 s时,占优对比算法和mintopK、partition、incpartition的运行时间加速比为10.77、6.46、5.69。实验结果表明,与其他偏好查询算法相比,所提算法所需的运行时间少,得到结果的效率更高。

    图表 | 参考文献 | 相关文章 | 多维度评价
    11. 基于关键帧筛选网络的视听联合动作识别
    陈亭秀, 尹建芹
    《计算机应用》唯一官方网站    2022, 42 (3): 731-735.   DOI: 10.11772/j.issn.1001-9081.2021060995
    摘要200)   HTML9)    PDF (771KB)(66)    收藏

    近年来,视听联合学习的动作识别获得了一定关注。无论在视频(视觉模态)还是音频(听觉模态)中,动作发生是瞬时的,往往在动作发生时间段内的信息才能够显著地表达动作类别。如何更好地利用视听模态的关键帧携带的显著表达动作信息,是视听动作识别待解决的问题之一。针对该问题,提出关键帧筛选网络KFIA-S,通过基于全连接层的线性时间注意力机制赋予每个时刻视听信息不同权重,从而筛选益于视频分类的视听特征,减少重复冗余信息,抑制背景干扰信息,提升动作识别精度。研究了不同强度的时间注意力对动作识别的影响。在ActivityNet数据集上的实验表明,KFIA-S网络达到了最先进的识别精度,证明了所提方法的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价
    12. 基于深度时空残差卷积神经网络的课堂教学视频中多人课堂行为识别
    黄勇康, 梁美玉, 王笑笑, 陈徵, 曹晓雯
    《计算机应用》唯一官方网站    2022, 42 (3): 736-742.   DOI: 10.11772/j.issn.1001-9081.2021040845
    摘要728)   HTML39)    PDF (2130KB)(419)    收藏

    针对课堂教学场景遮挡严重、学生众多,以及目前的视频行为识别算法并不适用于课堂教学场景,且尚无学生课堂行为的公开数据集的问题,构建了课堂教学视频库以及学生课堂行为库,提出了基于深度时空残差卷积神经网络的课堂教学视频中实时多人学生课堂行为识别算法。首先,结合实时目标检测和跟踪,得到每个学生的实时图片流;接着,利用深度时空残差卷积神经网络对每个学生行为的时空特征进行学习,从而实现课堂教学场景中面向多学生目标的课堂行为的实时识别;此外,构建了智能教学评估模型,并设计实现了基于学生课堂行为识别的智能教学评估系统,助力教学质量的提升,以实现智慧教育。通过在课堂教学视频数据集上进行实验对比与分析,验证了提出的课堂教学视频中实时多人学生课堂行为识别模型能够达到88.5%的准确率,且所构建的基于课堂行为识别的智能教学评估系统在课堂教学视频数据集上也已取得较好的运行效果。

    图表 | 参考文献 | 相关文章 | 多维度评价
    13. 基于深度注意力网络的课堂教学视频中学生表情识别与智能教学评估
    于婉莹, 梁美玉, 王笑笑, 陈徵, 曹晓雯
    《计算机应用》唯一官方网站    2022, 42 (3): 743-749.   DOI: 10.11772/j.issn.1001-9081.2021040846
    摘要473)   HTML16)    PDF (746KB)(213)    收藏

    为了解决复杂课堂场景下学生表情识别的遮挡的问题,同时发挥深度学习在智能教学评估应用上的优势,提出了一种基于深度注意力网络的课堂教学视频中学生表情识别模型与智能教学评估算法。构建了课堂教学视频库、表情库和行为库,利用裁剪和遮挡策略生成多路人脸图像,在此基础上构建了多路深度注意力网络,并通过自注意力机制为多路网络分配不同权重。通过约束损失函数限制各路权重的分配,将人脸图像的全局特征表示为每个支路的特征乘上注意力权重的和除以所有支路的注意力权重之和,并基于学习到的人脸全局特征进行学生课堂表情分类,实现遮挡情况下学生人脸表情识别。提出了融合课堂学生表情和行为状态的智能教学评估算法,实现了课堂教学视频中学生表情识别与智能教学评估。在公开数据集FERplus与自建课堂教学视频数据集上进行实验对比与分析,验证了提出的课堂教学视频中学生表情识别模型能够达到87.34%的准确率,且提出的融合课堂学生表情和行为状态的智能教学评估算法在课堂教学视频数据集上也取得优秀的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价
    14. 基于生成对抗网络和网络集成的面部表情识别方法EE-GAN
    杨鼎康, 黄帅, 王顺利, 翟鹏, 李一丹, 张立华
    《计算机应用》唯一官方网站    2022, 42 (3): 750-756.   DOI: 10.11772/j.issn.1001-9081.2021040807
    摘要466)   HTML16)    PDF (1422KB)(194)    收藏

    由于现实生活场景差异大,人类在不同场景中表现的情感也不尽相同,导致获取到的情感数据集标签分布不均衡;同时传统方法多采用模型预训练和特征工程来增强与表情相关特征的表示能力,但没有考虑不同特征表达之间的互补性,限制了模型的泛化性和鲁棒性。针对上述问题,提出了一种包含网络集成模型Ens-Net的端到端深度学习框架EE-GAN:一方面考虑了多个异质网络获得的不同深度和区域的特征,实现不同语义、不同层次的特征融合,并通过网络集成以提高模型的学习能力;另一方面,基于对抗生成网络生成具有特定表情标签的面部图像,在进行数据增强的同时,达到平衡表情标签数据分布的目的。在CK+、FER2013和JAFFE数据集上的定性和定量实验验证了所提方法的有效性:相较于局部保留投影方法(LPP)在内的基于视图学习的方法,EE-GAN面部表情识别的准确率最高,分别达到了82.1%、84.8%和91.5%;同时,和AlexNet、VGG、ResNet等传统卷积神经网络(CNN)模型相比,准确率最少提高了9个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    15. 基于Res2Net-YOLACT和融合特征的室内跌倒检测算法
    张璐, 方春, 祝铭
    《计算机应用》唯一官方网站    2022, 42 (3): 757-763.   DOI: 10.11772/j.issn.1001-9081.2021040857
    摘要469)   HTML18)    PDF (1061KB)(153)    收藏

    为了加强对老年人的监护、降低跌倒带来的安全风险,提出了一种新的基于Res2Net-YOLACT和融合特征的室内跌倒检测算法。首先,通过融入Res2Net模块的YOLACT网络来提取视频图像序列中的人体轮廓;然后,利用两级判断的方法做出跌倒决策,其中一级判别通过运动速度特征粗略判断是否发生异常状态,二级通过融合人体形状特征和深度特征的模型结构对人体姿势进行判别;最后,当检测出跌倒且发生时间大于阈值时,发出跌倒报警。实验结果表明,该跌倒检测算法可以在复杂的场景下很好地提取到人体轮廓,对光照的鲁棒性较好,并且检测速度可达每秒28帧,能满足实时检测要求。此外,融入手工特征后的算法分类性能表现更优,分类准确率达98.65%,比卷积神经网络(CNN)特征算法提升了1.03个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    16. 基于单标注样本的多损失学习与联合度量视频行人重识别
    殷雨昌, 王洪元, 陈莉, 冯尊登, 肖宇
    《计算机应用》唯一官方网站    2022, 42 (3): 764-769.   DOI: 10.11772/j.issn.1001-9081.2021040788
    摘要272)   HTML9)    PDF (710KB)(95)    收藏

    为解决行人重识别标注成本巨大的问题,提出了基于单标注样本的多损失学习与联合度量视频行人重识别方法。针对标签样本数量少,得到的模型不够鲁棒的问题,提出了多损失学习(MLL)策略:在每次训练过程中,针对不同的数据,采用不同的损失函数进行优化,提高模型的判别力。其次,在标签估计时,提出了一个联合距离度量(JDM),该度量将样本距离和近邻距离结合,进一步提升伪标签预测的精度。JDM改善了无标签数据标签估计的准确率低、未标记的数据没有被充分利用导致训练过程不稳定的问题。实验结果表明,和单标注样本渐进学习方法PL相比,当每次迭代增加的伪标签样本的比率为 0.10 时,在MARS和 DukeMTMC-VideoReID两个数据集上的rank-1准确度达到了65.5%和76.2%,分别提升了7.6和5.2个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    17. 基于神经网络的复杂垃圾信息过滤算法分析
    张建, 严珂, 马祥
    《计算机应用》唯一官方网站    2022, 42 (3): 770-777.   DOI: 10.11772/j.issn.1001-9081.2021040791
    摘要297)   HTML13)    PDF (610KB)(96)    收藏

    垃圾信息的识别是自然语言处理方面主要的任务之一。传统方法是基于文本特征或词频的方法,其识别准确率主要依赖于特定关键词的出现与否,存在对关键词识别错误或对未出现关键词的垃圾信息文本识别能力较差的问题,提出基于神经网络的方法。首先,利用传统方法针对这一类垃圾信息文本进行识别训练和测试;然后,利用从垃圾短信、广告和垃圾邮件数据集中挑选出传统方法识别困难的垃圾信息,再从原数据集中随机挑选出同样数量的正常信息,将其组成三个无重复数据的新数据集;最后,以卷积神经网络和循环神经网络为基础,建立了三个模型,并在新数据集上进行识别训练。实验结果表明,基于神经网络的方法可以从文本中学习到更好的语义特征,在三个数据集上均能达到98%以上的准确率,高于朴素贝叶斯(NB)、随机森林(RF)、支持向量机(SVM)等传统方法。实验结果还显示,不同的神经网络适用于不同长度的文本分类,由循环神经网络组成的模型擅长识别句子长度的文本,由卷积神经网络组成的模型擅长识别段落长度的文本,由两者共同组成的模型擅长识别篇章长度的文本

    图表 | 参考文献 | 相关文章 | 多维度评价
    18. 基于E-CARGO模型的共乘出行匹配建模与优化方法
    李晓会, 董红斌
    《计算机应用》唯一官方网站    2022, 42 (3): 778-782.   DOI: 10.11772/j.issn.1001-9081.2021060983
    摘要223)   HTML4)    PDF (574KB)(68)    收藏

    共乘出行应用系统通过提高汽车可用座位容量利用率来减少交通拥堵、缓解停车位紧张,提高社会效益和环境效益。司机和乘客的实时匹配和优化技术是共乘系统的核心内容。基于角色的协同(RBC)是一种用于促进组织结构、提供有序系统行为和协调系统内活动的新方法。为了减少乘客和司机的动态实时匹配时间、提高匹配效率,提出结合RBC和环境-类、代理、角色、群组和对象(E-CARGO)模型形式化共乘问题的方法。在资源容量约束和利润收入给定的情况下,对共乘匹配问题进行建模和仿真实验,提高可用座位容量利用率,实现平台收益最大化,资源匹配合理化。实验结果表明,基于E-CARGO模型的形式化方法可以应用于共乘出行匹配问题建模,最优匹配矩阵和时间可以采用Kuhn-Munkres(K-M)算法和Java中的优化软件包(ILOG)解决方案获得。与ILOG软件包算法相比,K-M算法所用平均时间至少减少了21%;当代理规模大于一定数值(大于600)时,算法时间开销急剧增大。

    图表 | 参考文献 | 相关文章 | 多维度评价
    19. 基于生成对抗网络的基因数据生成方法
    曹一珉, 蔡磊, 高敬阳
    《计算机应用》唯一官方网站    2022, 42 (3): 783-790.   DOI: 10.11772/j.issn.1001-9081.2021040759
    摘要301)   HTML14)    PDF (1786KB)(123)    收藏

    在深度学习中,随着卷积神经网络(CNN)的深度不断增加,进行神经网络训练所需的数据会越来越多,但基因结构变异在大规模基因数据中属于小样本事件,导致变异基因的图像数据十分匮乏,严重影响了CNN的训练效果,造成了基因结构变异检测精度差、假阳性率高等问题。为增加基因结构变异样本数量,提高CNN识别基因结构变异的精度,提出了一种基于生成对抗网络(GAN)进行基因图像数据扩增的方法——GeneGAN。首先,利用Reads堆叠方法生成初始基因图像数据,将变异基因图像数据与非变异基因图像数据分为两个数据集;然后,为了平衡正负样本数据集,使用GeneGAN对变异图像样本进行扩充;最后,通过CNN对平衡前后数据集进行检测,并对精确率、召回率与F1值进行对比。实验结果显示,与传统扩增方法、生成对抗网络扩增方法、特征提取方法相比,GeneGAN对基因结构变异检测的F1值提升了1.94~17.46个百分点,说明使用GeneGAN进行基因数据生成能够有效提高使用CNN进行基因图像分类的精确率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    20. 基于集合经验模态分解和长短期记忆网络的催化裂化装置氮氧化物排放预测
    陈冲, 闫珠, 赵继轩, 何为, 梁华庆
    《计算机应用》唯一官方网站    2022, 42 (3): 791-796.   DOI: 10.11772/j.issn.1001-9081.2021040787
    摘要209)   HTML4)    PDF (1269KB)(82)    收藏

    氮氧化物(NOx)是催化裂化(FCC)装置再生烟气中的主要污染物之一,准确预测NOx的排放浓度可有效避免炼化企业污染事件的发生。鉴于污染物排放数据具有非平稳、非线性和长记忆等特性,为了提高污染物排放浓度预测精度,提出一种基于集合经验模态分解(EEMD)和长短期记忆网络(LSTM)的耦合模型。将NOx排放浓度数据经过EEMD为若干个固有模态函数(IMF)和一个残差序列;根据IMF子序列与原始数据之间的相关性分析,剔除极弱相关的信号分量,有效减小原信号数据中的噪声;将IMF序列集分为高、低频两部分,分别进入不同深度的LSTM网络;最终,将子序列的预测结果反变换得到NOx排放浓度。实验表明,在催化裂化装置NOx排放预测中,对比LSTM的表现,EEMD-LSTM耦合模型在均方误差(MSE)、平均绝对误差(MAE)分别减小了46.7%、45.9%;在决定系数R2上增大了43%,实现了更高的预测精度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    21. 基于时序超图卷积神经网络的股票趋势预测方法
    李晓杰, 崔超然, 宋广乐, 苏雅茜, 吴天泽, 张春云
    《计算机应用》唯一官方网站    2022, 42 (3): 797-803.   DOI: 10.11772/j.issn.1001-9081.2021050748
    摘要1319)   HTML53)    PDF (742KB)(600)    收藏

    传统的股票预测方法大多基于时间序列模型,忽视了股票之间复杂的关系,并且该关系往往超出成对连接,例如同行业板块内股票或者基金持仓多支股票。针对该问题,提出一种基于时序超图卷积神经网络(HGCN)的股价走势预测方法,根据金融投资事实构造超图模型以拟合股票之间的多元关系,该模型包括两大组件:门控循环单元(GRU)网络和超图卷积神经网络。GRU网络对历史数据进行时间序列建模,捕捉长期依赖关系;HGCN建模股票间的高阶关系以学习内在关系属性,从而将股票间多元关系信息引入到传统的时序建模中,进行端到端的趋势预测。在中国A股市场真实数据集上的实验结果表明,相较于已有的股票预测方法,所提模型预测性能有所提升;如与GRU网络相比,所提模型在ACC和F1_score上的相对增幅分别为9.74%和8.13%,且更具有稳定性。此外,模拟回测结果显示,基于该模型的交易策略更具获利能力,年回报率达到11.30%,与长短期记忆(LSTM)网络相比提高了5个百分点。

    图表 | 参考文献 | 相关文章 | 多维度评价
    22. 基于多尺度特征融合的红外单目测距算法
    刘斌, 李港庆, 安澄全, 王水根, 王建生
    《计算机应用》唯一官方网站    2022, 42 (3): 804-809.   DOI: 10.11772/j.issn.1001-9081.2021040912
    摘要369)   HTML11)    PDF (1946KB)(131)    收藏

    由于MonoDepth2的提出,无监督单目测距在可见光领域取得了重大发展;然而在某些场景例如夜间以及一些低能见度的环境,可见光并不适用,而红外热成像可以在夜间和低能见度条件下获得清晰的目标图像,因此对于红外图像的深度估计显得尤为必要。由于可见光和红外图像的特性不同,直接将现有可见光单目深度估计算法迁移到红外图像是不合理的。针对该问题,对MonoDepth2算法进行改进,提出了基于多尺度特征融合的红外单目测距算法。针对红外图像低纹理的特性设计了一项新的损失函数边缘损失函数,旨在降低图像重投影时的像素误匹配。不同于以往的无监督单目测距单纯地将四个尺度的深度图统一上采样到原图像分辨率计算投影误差而忽略了尺度之间的关联性以及不同尺度之间的贡献差异,将加权的双向特征金字塔网络(BiFPN)应用于多尺度深度图的特征融合,解决了深度图边缘模糊问题。另外用跨阶段部分网络(CSPNet)替换残差网络(ResNet)结构,以降低网络复杂度并提高运算速度。实验结果表明,边缘损失更适合红外图像测距,使得深度图质量更高;在加入BiFPN结构之后,深度图像的边缘更加清晰;将ResNet替换为CSPNet之后,推理速度提高了大约20个百分点。该算法能够准确估计出红外图像的深度,解决夜间低光照场景以及一些低能见度场景下的深度估计难题;该算法的应用也可以在一定程度上降低汽车辅助驾驶的成本。

    图表 | 参考文献 | 相关文章 | 多维度评价
    23. 交通道路行驶车辆车标识别算法
    李讷, 徐光柱, 雷帮军, 马国亮, 石勇涛
    《计算机应用》唯一官方网站    2022, 42 (3): 810-817.   DOI: 10.11772/j.issn.1001-9081.2021040860
    摘要397)   HTML23)    PDF (7541KB)(131)    收藏

    为解决交通道路行驶车辆车标识别中存在的目标小、噪声大、种类多的问题,提出了一种基于深度学习的目标检测算法与基于形态学模板匹配算法相结合的方法,并设计了一种高准确度且能应对新类型车标的识别系统。首先,采用通过K-Means++重新聚类锚框值,并引入残差网络的YOLOv4进行车标的一步定位;其次,通过对标准车标图像进行预处理及分割,构建二值车标模板库;接着,利用带色彩恢复的多尺度视网膜图像增强算法(MSRCR)、最大类间方差法(OTSU)等对定位到的车标进行预处理;最后,将处理好的车标与模板库中的标准车标进行汉明距离计算,求出最佳匹配。车标检测实验中,改进的YOLOv4检测精度均优于原始YOLOv4、基于车牌位置的车标两步定位法和基于散热器栅格背景的车标定位法,达到99.04%;速度略低于原始YOLOv4,高于另外两者,达到每秒50.62帧。车标识别实验中基于形态学模板匹配的识别精度均高于传统的方向梯度直方图(HOG)、局部二值模式(LBP)和卷积神经网络,达到92.68%。实验结果表明基于深度学习的车标检测算法有较高的精度和较快的速度,形态学模板匹配方法在光照变化和噪声污染的情况下仍能保持较高的识别精度。

    图表 | 参考文献 | 相关文章 | 多维度评价
    24. 基于注意力机制的多尺度残差UNet实现乳腺癌灶分割
    罗圣钦, 陈金怡, 李洪均
    《计算机应用》唯一官方网站    2022, 42 (3): 818-824.   DOI: 10.11772/j.issn.1001-9081.2021040948
    摘要1312)   HTML49)    PDF (1860KB)(344)    收藏

    针对乳腺癌灶在磁共振成像(MRI)中呈现大小形状不一、边界模糊等特点,为避免误分割并提高分割精度,提出一种基于注意力机制的多尺度残差UNet分割算法。首先,利用多尺度残差单元替换UNet在下采样过程中的相邻两个卷积块以加强对形态大小差异的关注;接着,在上采样阶段使用跨层的注意力引导网络对重点区域的关注,避免造成对健康组织的误分割;最后,引入空洞空间金字塔池化作为分割网络的桥接模块以强化对病灶的表征能力。与UNet相比,所提算法在Dice系数、交并比(IoU)、特异度(SP)、准确度(ACC)等指标上分别提升了2.26、2.11、4.16、0.05个百分点。实验结果表明,所提算法能够提高癌灶分割精度,有效降低影像诊断的假阳性率。

    图表 | 参考文献 | 相关文章 | 多维度评价
    25. U-Net与自适应阈值脉冲耦合神经网络相结合的眼底血管分割方法
    徐光柱, 林文杰, 陈莎, 匡婉, 雷帮军, 周军
    《计算机应用》唯一官方网站    2022, 42 (3): 825-832.   DOI: 10.11772/j.issn.1001-9081.2021040856
    摘要332)   HTML18)    PDF (1357KB)(152)    收藏

    由于眼底血管结构复杂多变,且图像中血管与背景对比度低,眼底血管分割存在巨大困难,尤其是微小型血管难以分割。基于深层全卷积神经网络的U-Net能够有效提取血管图像全局及局部信息,但由于其输出为灰度图像,并采用硬阈值实现二值化,这会导致血管区域丢失、血管过细等问题。针对这些问题,提出一种结合U-Net与脉冲耦合神经网络(PCNN)各自优势的眼底血管分割方法。首先使用迭代式U-Net模型凸显血管,即将U-Net模型初次提取的特征与原图融合的结果再次输入改进的U-Net模型进行血管增强;然后,将U-Net输出结果视为灰度图像,利用自适应阈值PCNN对其进行精准血管分割;在U-Net模型中引入Batch Normalization和Dropout,提高训练速度,有效缓解过拟合问题。实验结果表明,所提方法的AUC在DRVIE、STARE和CHASE_DB1数据集上分别为0.979 6,0.980 9和0.982 7。该方法可以提取更多的血管细节,且具有较强的泛化能力和良好的应用前景。

    图表 | 参考文献 | 相关文章 | 多维度评价
2024年 44卷 3期
刊出日期: 2024-03-10
文章目录
过刊浏览
荣誉主编:张景中
主  编:徐宗本
副主编
:申恒涛 夏朝晖

国内邮发代号:62-110
国外发行代号:M4616
地址:四川成都双流区四川天府新区
   兴隆街道科智路1369号
   中科信息(科学城园区) B213
   (计算机应用编辑部)
电话:028-85224283-803
   028-85222239-803
网址:www.joca.cn
E-mail: bjb@joca.cn
期刊微信公众号
CCF扫码入会