《计算机应用》唯一官方网站

深度融合多视图聚类网络

何子仪, 杨燕, 张熠玲

2023, 43(9): 2651-2656. DOI: 10.11772/j.issn.1001-9081.2022091394

摘要 ( )

HTML ( )

PDF (1074KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的深度多视图聚类方法存在以下缺点：1）在对单一视图进行特征提取时，只考虑了样本的属性信息或结构信息，而没有将二者进行融合，导致提取到的特征不能充分表示原始数据的潜在结构；2）将特征提取与聚类划分为两个独立的过程，没有建立两者间的联系，因此无法利用聚类过程优化特征提取过程。针对以上问题，提出一种深度融合多视图聚类网络（DFMCN）。首先，结合自编码器和图卷积自编码器融合样本的属性信息和结构信息，获取每个视图的嵌入空间；然后，通过加权融合获取融合视图嵌入空间并在此空间中进行聚类，并且在聚类过程中采用双层自监督机制优化特征提取过程。在FM（Fashion-MNIST）、HW（HandWritten numerals）、YTF（YouTube Face）数据集上的实验结果表明：DFMCN的准确率高于所有对比方法；在FM数据集上，DFMCN的准确率比次优的CMSC-DCCA（Cross-Modal Subspace Clustering via Deep Canonical Correlation Analysis）方法提高了1.80个百分点，标准化互信息（NMI）高于除CMSC-DCCA和DMSC（Deep Multimodal Subspace Clustering networks）的所有方法1.26~14.84个百分点。实验结果验证了所提方法的有效性。

基于自适应学习的多视图无监督特征选择方法

何添, 沈宗鑫, 黄倩倩, 黄雁勇

2023, 43(9): 2657-2664. DOI: 10.11772/j.issn.1001-9081.2022091404

摘要 ( )

HTML ( )

PDF (1956KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的多视图无监督特征选择方法大多存在以下问题：样本的相似度矩阵、不同视图的权重矩阵和特征的权重矩阵往往是预先定义的，不能有效刻画数据间的真实结构以及反映不同视图和特征的重要性，进而导致不能选出有用的特征。为解决上述问题，首先，在多视图模糊C均值聚类的基础上进行视图权重和特征权重的自适应学习，以同时实现特征选择并保证聚类性能；然后，在拉普拉斯秩约束下自适应地学习样本的相似度矩阵，并构建一个基于自适应学习的多视图无监督特征选择（ALMUFS）方法；最后，设计一种交替迭代优化算法对目标函数进行求解，并在8个真实数据集上将所提方法与6种无监督特征选择基线方法进行比较。实验结果表明，ALMUFS的聚类精度和F-measure优于其他方法，与自适应协作相似性学习（ACSL）相比，平均提高8.99和11.87个百分点；与ASVM（Adaptive Similarity and View Weight）相比，平均提高11.09和13.21个百分点，验证了所提方法的可行性和有效性。

基于高阶一致性学习的聚类集成算法

甘舰文, 陈艳, 周芃, 杜亮

2023, 43(9): 2665-2672. DOI: 10.11772/j.issn.1001-9081.2022091406

摘要 ( )

HTML ( )

PDF (2069KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的大部分关于聚类集成的研究主要关注有效的集成算法的设计。为解决由于基聚类器的质量高低不一、低质量的基聚类器对聚类集成性能产生影响的问题，从数据发掘的角度出发，以基聚类器为基础挖掘数据的内在联系，提出一种高阶信息融合算法——基于高阶一致性学习的聚类集成（HCLCE）算法，从不同的维度表示数据之间的联系。首先，将每种高阶信息融合成一个新的结构化的一致性矩阵；然后，再对得到的多个一致性矩阵进行融合；最后，将多种信息融合为一个一致性的结果。实验结果表明，与次优的LWEA（Locally Weighted Evidence Accumulation）算法相比，HCLCE算法的聚类准确率平均提升了7.22%，归一化互信息（NMI）平均提升了9.19%。可见，HCLCE能得到比聚类集成算法和单独使用一种信息更好的聚类结果。

有序规范实数对多相似度K最近邻分类算法

崔昊阳, 张晖, 周雷, 杨春明, 李波, 赵旭剑

2023, 43(9): 2673-2678. DOI: 10.11772/j.issn.1001-9081.2022091376

摘要 ( )

HTML ( )

PDF (1618KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对最近邻分类算法性能受到所采用的相似度或距离度量方法影响大，且难以选择最优的相似度或距离度量方法的问题，提出一种采用多相似度的基于有序规范实数对的K最近邻分类算法（OPNs-KNN）。首先，在机器学习领域中引入有序规范实数对（OPN）这一新的数学理论，利用多种相似度或距离度量方法将训练集和测试集中所有样本全部转换为OPN，使每个OPN均包含不同的相似度信息；然后再通过改进的最近邻算法对OPN进行分类，实现不同相似度或距离度量方法的结合与互补，从而提高分类性能。实验结果表明，在Iris、seeds等数据集上与距离加权K近邻规则（WKNN）等6种最近邻分类的改进算法相比，OPNs-KNN的分类准确率提高了0.29~15.28个百分点，验证了所提算法能大幅提升分类的性能。

双收敛因子策略下的改进灰狼优化算法

欧云, 周恺卿, 尹鹏飞, 刘雪薇

2023, 43(9): 2679-2685. DOI: 10.11772/j.issn.1001-9081.2022091389

摘要 ( )

HTML ( )

PDF (988KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对标准灰狼优化算法（GWO）的收敛速度慢、易陷入局部最优等缺点，提出一种在非线性双收敛因子策略下基于双头狼引领的改进灰狼优化（GWO-THW）算法。首先，利用混沌Cubic映射初始化种群，提升种群分布的均匀性和多样性，并通过平均适应度值将狼群分为捕猎狼和侦察狼，两类狼群采用不同的收敛因子，在各自的头狼带领下寻找和围捕猎物；其次，为提升搜索速度和精度，设计了一种位置更新的自适应权重因子；同时，为跳出局部最优，当一定时间内未发现猎物时，狼群采用莱维（Levy）飞行策略随机更新位置。在10个常用的基准测试函数上验证GWO-THW的有效性。实验结果表明，与标准GWO及相关变体相比，GWO-THW在8个基准测试函数上都取得了较高的寻优精度和收敛速度，尤其在多峰函数上，200次迭代内就能收敛到理想最优值，从而验证了GWO-THW具有更好的寻优性能。

基于混合机制的深度神经网络压缩算法

赵旭剑, 李杭霖

2023, 43(9): 2686-2691. DOI: 10.11772/j.issn.1001-9081.2022091392

摘要 ( )

HTML ( )

PDF (2917KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

近年来人工智能（AI）应用飞速发展，嵌入式设备与移动设备等有限资源设备对深度神经网络（DNN）的需求急剧增加。如何在不影响DNN效果的基础上对神经网络进行压缩具有极大理论与现实意义，也是当下深度学习的热门研究话题。首先，针对DNN因模型大、计算量大而难以移植至移动设备等有限资源设备的问题，深入分析已有DNN压缩算法在内存占用、运行速度及压缩效果等方面的实验性能，从而挖掘DNN压缩算法的影响要素；然后，设计学生网络和教师网络组成的知识迁移结构，融合知识蒸馏、结构设计、网络剪枝和参数量化机制，提出基于混合机制的DNN优化压缩算法。在mini-ImageNet数据集上以AlexNet为Benchmark，进行实验比较与分析。实验结果表明，所提算法在压缩结果的准确率降低6.3%的情况下，使压缩后的AlexNet的容量减小98.5%，验证了所提算法的有效性。

融合大核注意力卷积的轻量化图像篡改定位算法

王宏, 钱清, 王欢, 龙永

2023, 43(9): 2692-2699. DOI: 10.11772/j.issn.1001-9081.2022091405

摘要 ( )

HTML ( )

PDF (2288KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

卷积神经网络（CNN）因辨识度高、易于理解、可学习性强而被用于图像取证，但它固有的感受野增加缓慢、忽略长端依赖性、计算量庞大等缺点导致深度学习算法的精度与轻量化部署效果并不理想，不适用于以轻量化形式实现图像篡改定位的场景。为解决上述问题，提出一种基于轻量化网络的图像复制-粘贴篡改检测算法——LKA-EfficientNet（Large Kernel Attention EfficientNet）。LKA-EfficientNet具有长端依赖性和全局感受野的特性，且优化了EfficientNetV2的参数量，提高了图像篡改定位速度和精度。首先，将输入图像通过基于大核注意力（LKA）卷积的基干网络进行处理，得到候选特征图；随后，使用不同尺寸的特征图构建特征金字塔进行特征匹配；最后，将特征匹配后的特征图进行融合以定位图像篡改区域；此外，LKA-EfficientNet使用三元组交叉熵损失函数进一步提升了算法定位篡改图像的精度。实验结果表明，LKA-EfficientNet与同类型的Dense-InceptionNet算法相比，不仅能够降低29.54%的浮点运算量，而且F1分数也提高了4.88%，验证了LKA-EfficientNet可以在保持高检测性能的同时降低计算量。

基于森林的实体关系联合抽取模型

王炫力, 靳小龙, 侯中妮, 廖华明, 张瑾

2023, 43(9): 2700-2706. DOI: 10.11772/j.issn.1001-9081.2022091419

摘要 ( )

HTML ( )

PDF (1117KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

嵌套实体对实体关系联合提取任务提出了挑战。现有的联合抽取模型在处理嵌套实体时存在产生大量负例且复杂度高的问题，此外未考虑嵌套实体对三元组预测的干扰。针对以上问题，提出一种基于森林的实体关系联合抽取方法——EF2LTF（Entity Forest to Layering Triple Forest）。EF2LTF采用了一个两阶段的联合训练框架，首先通过生成实体森林灵活地在嵌套实体内部识别不同的实体；然后结合已识别出的嵌套实体及其层次结构生成分层的三元组森林。在四个标准数据集上的实验结果表明，与基于集合预测网络的SPN（Set Prediction Network）模型、基于跨度的实体关系联合抽取模型SpERT（Span-based Entity and Relation Transformer）和动态图增强信息抽取（DyGIE++）等方法相比，所提方法取得了最优的F1值。说明所提方法既增强了嵌套实体的识别能力，也增强了构建三元组时对嵌套实体的分辨能力，从而提升了实体与关系的联合抽取性能。

融合局部语义特征的学者细粒度信息提取方法

田悦霖, 黄瑞章, 任丽娜

2023, 43(9): 2707-2714. DOI: 10.11772/j.issn.1001-9081.2022091407

摘要 ( )

HTML ( )

PDF (1296KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

从学者主页中提取的学者细粒度信息（如学者研究方向、教育经历等）在大规模专业人才库的创建等方面具有非常重要的应用价值。针对现有学者细粒度信息提取方法无法有效利用上下文语义联系的问题，提出一种融合局部语义特征的学者信息提取方法，利用局部范围文本的语义联系对学者主页进行细粒度信息抽取。首先，通过全词掩码中文预训练模型RoBERTa-wwm-ext学习通用语义表征；之后将通用语义表征中的目标句表征向量与局部相邻文本表征向量共同输入卷积神经网络（CNN）实现局部语义融合，从而获得更高维度的目标句表征向量；最终将目标句表征向量从高维度空间映射到低维度标签空间实现学者主页细粒度信息的抽取。实验结果表明，使用此融合局部语义特征的方法进行学者细粒度信息提取的宏平均F1值达到93.43%，与未融合局部语义的RoBERTa-wwm-ext-TextCNN方法相比提高了8.60个百分点，验证了所提方法在学者细粒度信息提取任务上的有效性。

基于拼音相似度的中文谐音新词发现方法

李瀚臣, 张顺香, 朱广丽, 王腾科

2023, 43(9): 2715-2720. DOI: 10.11772/j.issn.1001-9081.2022091390

摘要 ( )

HTML ( )

PDF (927KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

新词识别作为自然语言处理的基础任务之一，为构建中文词典、分析词语情感倾向等提供了支持。然而，目前的新词识别方法没有考虑针对谐音新词的识别，导致谐音新词识别的准确率不高。为了解决这一问题，提出一种基于拼音相似度的中文谐音新词发现方法，引入新旧词拼音比较来提高谐音新词识别的准确率。首先，对文本进行预处理，计算平均互信息（AMI）以判定候选词的内部结合度，并使用改进邻接熵确定候选新词的边界；然后，将保留下的词转换成发音相近的汉语拼音与中文词典中的旧词拼音进行相似度比较，并保留最相似的比较结果；最后，若比较结果超过阈值，则将结果中的新词作为谐音新词，对应的旧词即为谐音新词的原有词。在自建的微博数据集上的实验结果表明，与BNshCNs（Blended Numeric and symbolic homophony Chinese Neologisms）、依存句法与语义信息结合的相似性计算模型（DSSCNN）相比，所提方法的准确率、召回率和F1分数分别提高了0.51和5.27个百分点、2.91和6.31个百分点以及1.75和5.81个百分点。可见所提方法具有更好的中文谐音新词识别效果。

基于元网络的自动国际疾病分类编码模型

周晓敏, 滕飞, 张艺

2023, 43(9): 2721-2726. DOI: 10.11772/j.issn.1001-9081.2022091388

摘要 ( )

HTML ( )

PDF (1032KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

国际疾病分类（ICD）编码的频率分布呈现出长尾的情况，因此，对少样本编码进行多标签文本分类极具挑战性。针对少样本编码分类中训练数据不足的问题，提出了一种基于元网络的自动ICD编码模型（MNIC）。首先，将特征空间中的实例和语义空间中的特征拟合到同一个空间进行映射，并将频繁编码的特征表示映射到它的分类器权重上，从而通过元网络学习到元知识；然后将学习到的元知识从数据丰富的频繁编码转移到数据贫乏的少样本编码；最后，为元知识的可转移性和通用性提供了合理的解释。在MIMIC-Ⅲ数据集上的实验结果表明，与次优的AGM-HT（Adversarial Generative Model conditioned on code descriptions with Hierarchical Tree structure）模型相比，MNIC将少样本编码的Micro-F1与曲线下面积（Micro-AUC）分别提高了3.77和3.82个百分点，显著提高了少样本编码分类的性能。

基于上下文信息和多尺度融合重要性感知的特征金字塔网络算法

杨昊, 张轶

2023, 43(9): 2727-2734. DOI: 10.11772/j.issn.1001-9081.2022081249

摘要 ( )

HTML ( )

PDF (2864KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对目标检测中分类和定位子任务分别需要大感受野和高分辨率，难以在这两个相互矛盾的需求间取得平衡的问题，提出一种用于目标检测的基于注意力机制的特征金字塔网络算法。该算法能整合多个不同感受野来获取更丰富的语义信息，以一种更关注不同特征图重要性的方式融合多尺度特征图，并在注意力机制引导下进一步精练复杂融合后的特征图。首先，通过多尺度的空洞卷积获取多尺度感受野，在保留分辨率的同时增强语义信息；其次，通过多级特征融合（MLF）方式将多个不同尺度的特征图通过上采样或池化操作变为相同分辨率后融合；最后，利用注意力引导的特征精练模块（AFRM）对融合后的特征图作精练处理，丰富语义信息并消除融合带来的混叠效应。将所提特征金字塔替换Faster R-CNN中的特征金字塔网络（FPN）后在MS COCO 2017数据集上进行实验，结果表明当骨干网络为深度50和101的残差网络（ResNet）时，平均精度（AP）分别达到了39.2%和41.0%，与使用原FPN的Faster R-CNN相比，分别提高了1.4和1.0个百分点。可见，所提特征金字塔网络算法能替代原FPN，更好地应用在目标检测场景中。

基于提示学习的小样本文本分类方法

于碧辉, 蔡兴业, 魏靖烜

2023, 43(9): 2735-2740. DOI: 10.11772/j.issn.1001-9081.2022081295

摘要 ( )

HTML ( )

PDF (884KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

文本分类任务通常依赖足量的标注数据，针对低资源场景下的分类模型在小样本上的过拟合问题，提出一种基于提示学习的小样本文本分类方法BERT-P-Tuning。首先，利用预训练模型BERT（Bidirectional Encoder Representations from Transformers）在标注样本上学习到最优的提示模板；然后，在每条样本中补充提示模板和空缺，将文本分类任务转化为完形填空任务；最后，通过预测空缺位置概率最高的词并结合它与标签之间的映射关系得到最终的标签。在公开数据集FewCLUE上的短文本分类任务上进行实验，实验结果表明，所提方法相较于基于BERT微调的方法在评价指标上有显著提高。所提方法在二分类任务上的准确率与F1值分别提升了25.2和26.7个百分点，在多分类任务上的准确率与F1值分别提升了6.6和8.0个百分点。相较于手动构建模板的PET（Pattern Exploiting Training）方法，所提方法在两个任务上的准确率分别提升了2.9和2.8个百分点，F1值分别提升了4.4和4.2个百分点，验证了预训练模型应用在小样本任务的有效性。

基于深度图神经网络的协同推荐算法

潘润超, 虞启山, 熊泓霏, 刘智慧

2023, 43(9): 2741-2746. DOI: 10.11772/j.issn.1001-9081.2022091361

摘要 ( )

HTML ( )

PDF (1539KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有基于图神经网络（GNN）的推荐算法面临的过平滑的问题，提出一种基于深度GNN的协同过滤推荐算法Deep NGCF（Deep Neural Graph Collaborative Filtering）。该算法在GNN中引入初始残差连接和恒等映射，避免了GNN进行多次图卷积运算后陷入过平滑。首先，通过用户和项目的交互历史得到它们的初始嵌入；其次，在聚合传播层利用初始残差连接和恒等映射得到用户和项目的不同阶协同信号；最后，对所有协同信号进行线性表示以得到预测评分。此外，在初始残差连接和恒等映射中设置比重进行调节，从而进一步提高模型的灵活性和推荐性能。为验证Deep NGCF算法的可行性和有效性，在Gowalla、Yelp-2018与Amazon-Book数据集上进行实验。实验结果表明，相较于图卷积矩阵补全（GCMC）、神经图协同过滤（NGCF）等现有的GNN推荐算法，Deep NGCF算法取得了最高的召回率和归一化折损累计增益（NDCG），验证了所提算法的有效性。

融合遗忘因素与记忆门的图神经网络知识追踪模型

郑浩东, 马华, 谢颖超, 唐文胜

2023, 43(9): 2747-2752. DOI: 10.11772/j.issn.1001-9081.2022081184

摘要 ( )

HTML ( )

PDF (1266KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

知识追踪任务根据学生历史学习数据实时诊断学生的认知状态，并预测他未来的答题表现。为准确建模知识追踪中的遗忘行为和答题序列的时序特征，提出一种融合遗忘因素与记忆门的图神经网络知识追踪（GKT-FM）模型。首先，GKT-FM模型通过历史答题记录计算知识点相关性，构建知识图；其次，采用图神经网络（GNN）建模学生的认知状态，综合考虑7个影响遗忘行为的特征；然后，以记忆门结构建模学生答题序列中的时序特征，重构基于GNN的知识追踪更新过程；最后，融合遗忘因素和时序特征得到预测结果。在公开数据集ASSISTments2009和KDDCup2010上的实验结果表明，相较于GKT（Graph-based Knowledge Tracing）模型，GKT-FM模型的平均曲线下面积（AUC）分别提升了6.9%和9.5%，平均精度（ACC）分别提升了5.3%和6.7%，可见，GKT-FM模型能更好地建模学生的遗忘行为、追踪学生的认知状态。

融合提示知识的方面级情感分析方法

张心月, 刘蓉, 魏驰宇, 方可

2023, 43(9): 2753-2759. DOI: 10.11772/j.issn.1001-9081.2022091347

摘要 ( )

HTML ( )

PDF (1699KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对基于预训练模型的方面级情感分析普遍使用端到端框架，存在上下游阶段任务不一致、难以有效建模方面词和上下文之间关系的问题，提出一种融合提示知识的方面级情感分析方法。首先基于Prompt机制构造提示文本，将该提示文本与原始句子和方面词进行拼接，并把得到的结果作为预训练模型BERT（Bidirectional Encoder Representation from Transformers）的输入，以有效捕获方面词和上下文之间的语义联系，同时提升模型对情感分析任务的感知能力；然后构建情感标签词表，并将它融入情感标签词映射层，以减小模型的搜索空间，使预训练模型获取标签词表中丰富的语义知识，并增强模型的学习能力。实验结果表明，所提方法在SemEval2014 Task4数据集的Restaurant、Laptop两个领域数据集和ChnSentiCorp数据集上的F1值分别达到了77.42%、75.20%、94.89%，与Glove-TextCNN、P-tuning等主流方面级情感分析方法相比提高了0.65~10.71、1.02~9.58与0.83~6.40个百分点，验证了所提方法对方面级情感分析的有效性。

基于门控卷积的时空交通流预测模型

徐丽, 符祥远, 李浩然

2023, 43(9): 2760-2765. DOI: 10.11772/j.issn.1001-9081.2022081146

摘要 ( )

HTML ( )

PDF (2271KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有的交通流预测模型未能精确捕获交通数据的时空特征，以及大部分模型都是在单步预测中体现出良好的预测性能，在多步预测中模型的预测性能显得并不理想的问题，提出了一种基于门控卷积的时空交通流预测模型（GC-STTFPM）。首先，利用图卷积网络（GCN）结合门控循环单元（GRU）来捕获交通流数据的时空特征；然后提出了一种利用卷积门控单元对原始数据和时空特征数据进行拼接与筛选处理的方法来对时空特征数据的有效性进行校验；最后，将GRU作为解码器来对未来交通流作出准确可靠的预测。在洛杉矶公路的交通数据集上的实验结果表明，GC-STTFPM在单步预测（5 min）中与基于注意力的时空图神经网络（ASTGNN）和扩散卷积递归神经网络（DCRNN）相比，平均绝对误差（MAE）分别降低了5.9%和9.9%，均方根误差（RMSE）分别降低了1.7%和5.8%。同时，GC-STTFPM在15、30、60 min三个多步尺度下的预测精度优于大多数现有基准模型，具有较强的适应性和鲁棒性。

低编译复杂度的双容错阵列码

解峥, 王子豪, 唐聃, 张航, 蔡红亮

2023, 43(9): 2766-2774. DOI: 10.11772/j.issn.1001-9081.2022091344

摘要 ( )

HTML ( )

PDF (2691KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

纠删码技术是独立磁盘冗余阵列-6（RAID-6）的双容错能力的底层实现技术，它的性能是左右RAID-6性能的重要因素。针对RAID-6中常用阵列纠删码的I/O不平衡和数据恢复速度慢的问题，提出一种基于异或（XOR）的混合阵列码——J码（J-code）。J-code采用新的校验生成规则，首先，利用原始数据构造的二维阵列计算出对角校验位并构造新的阵列；然后，利用新阵列中数据块之间的位置关系计算得到反对角校验位。此外，J-code将原始数据与部分校验位存储于同一磁盘，能减少编译码过程中的异或（XOR）操作次数和单盘恢复过程中读取数据块的个数，从而降低编译码复杂度和单盘故障修复的I/O成本，缓解磁盘热点集中现象。仿真实验结果表明，相较于RDP（Row-Diagonal Parity）、EaR（Endurance-aware RAID-6）等阵列码，J-code的编码时间减少了0.30%~28.70%，单磁盘故障和双磁盘故障的修复用时分别减少了2.23%~31.62%和0.39%~36.00%。

动态异构信息融合的科研合作潜力预测

马国帅, 钱宇华, 张亚宇, 李俊霞, 刘郭庆

2023, 43(9): 2775-2783. DOI: 10.11772/j.issn.1001-9081.2022081266

摘要 ( )

HTML ( )

PDF (1968KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的科研合作潜力预测方法使用特征工程来人工提取科研合作网络中作者的浅层静态属性，忽略了科研合作网络中异构实体间的关联关系。针对以上不足，提出融合科研合作网络中的多种实体潜在属性信息的动态合作潜力预测（CPP）模型，在提取异构实体的属性的同时考虑了学者与学者之间合作关系的结构特征，并且通过协同优化的方式优化模型，实现了在为学者进行科研合作者推荐的同时预测科研合作潜力的目标。为验证所提模型的有效性，搜集整理了发表在中国计算机学会（CCF）推荐期刊中的50余万篇论文信息以及相关实体的完整属性信息，并采用滑窗法构建了不同时间段的时序合作异构网络，以提取科研合作网络演化过程中的各实体的动态属性信息。此外，为提高所提模型的泛化性以及实用性，随机输入不同时段的数据对模型进行训练。实验结果表明，相较于次优的多层采样聚合图神经网络（GraphSAGE），CPP模型在合作者推荐任务上的分类精确度提高了1.47个百分点；在合作潜力预测任务上的测试误差降低了1.23%。说明了CPP模型能更精准地为学者推荐优质合作者。

缩减轮的超轻量级分组密码算法PFP的不可能差分分析

赵光耀, 沈璇, 余波, 易晨晖, 李祯

2023, 43(9): 2784-2788. DOI: 10.11772/j.issn.1001-9081.2022091395

摘要 ( )

HTML ( )

PDF (1455KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

基于Feistel结构的轻量级分组密码算法PFP适用于物联网终端设备等资源极端受限环境。目前对PFP算法不可能差分分析的最好结果是利用7轮不可能差分区分器攻击9轮PFP算法，这样可恢复36 b的种子密钥。为了更准确地评估PFP算法抵抗不可能差分分析的能力，对PFP算法结构进行研究。首先，通过分析轮函数中S盒的差分分布特性，找到了概率为1的两组差分；其次，结合置换层特点，构造出一组包含16条不可能差分的7轮不可能差分区分器；最后，基于构建的7轮不可能差分区分器，对9轮PFP算法进行不可能差分分析以恢复40 b种子密钥，并提出对10轮PFP算法的不可能差分分析方法来恢复52 b种子密钥。结果表明，所提方法在区分器数量、分析轮数、恢复密钥比特数等方面均有较大改善。

基于区块链可撤销属性的去中心化属性基加密方案

马海英, 李金舟, 杨及坤

2023, 43(9): 2789-2797. DOI: 10.11772/j.issn.1001-9081.2023020138

摘要 ( )

HTML ( )

PDF (952KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对现有属性基加密（ABE）方案存在的属性撤销效率低以及用户属性密钥的分发和撤销难以协调等问题，提出一种基于区块链可撤销属性的去中心化属性基加密（BRDABE）方案。首先，利用共识驱动的区块链构架将密钥分发的信任问题从属性权威映射到分布式账本上，并利用智能合约记录用户属性和数据共享的状态以及协助属性权威实现用户属性的撤销。当撤销用户的属性时，属性权威利用智能合约自动筛选出所涉及的数据所有者和未撤销授权的用户，并生成与撤销属性相关的密文更新钥和密钥更新钥，链下进行密文和密钥更新。其次，将版本钥和用户全局身份嵌入属性私钥，在用户解密时，使会话密钥密文和用户属性私钥中的身份能够相互抵消。基于合理假设，证明BRDABE方案能抵抗用户的合谋攻击，且满足用户属性撤销的前向和后向安全性。实验结果表明，随着用户属性个数的增加，用户密钥生成、加密解密和属性撤销的时间呈线性增长。当属性个数相同时，与DABE（Decentralizing Attribute-Based Encryption）相比，BRDABE的解密时间缩短了94.06%~94.75%；与EDAC-MCSS（Effective Data Access Control for Multiauthority Cloud Storage Systems）相比，BRDABE的属性撤销时间缩短了92.19%~92.27%。因此，BRDABE方案不仅提高了属性撤销的效率，而且保障了共享数据的前向和后向安全性。

NTRU格上基于身份的环签名方案

李金波, 张平, 张冀, 刘牧华

2023, 43(9): 2798-2805. DOI: 10.11772/j.issn.1001-9081.2022081268

摘要 ( )

HTML ( )

PDF (962KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对格基环签名方案的陷门基尺寸过大以及环成员的公钥需要数字证书认证的问题，提出一种NTRU（Number Theory Research Unit）格上的身份基环签名方案（NTRU-IBRS）。首先，使用NTRU格上的陷门生成算法生成系统的主公私钥对；然后，将主私钥作为陷门信息并对单向函数进行求逆运算以得到环成员的私钥；最后，基于小整数解（SIS）问题使用拒绝抽样技术生成环签名。安全性分析表明，NTRU-IBRS在随机预言机模型下具有匿名性以及适应性选择消息和身份攻击下的存在不可伪造性。性能分析与实验仿真表明，与理想格上的环签名方案和NTRU格上的身份基可链接环签名方案相比，在存储开销方面，NTRU-IBRS的系统私钥长度下降了0~99.6%，签名私钥长度的下降了50.0%~98.4%；在时间开销方面，NTRU-IBRS的总时间开销减少了15.3%~21.8%。将NTRU-IBRS应用于动态车联网（IoV）场景中，模拟结果表明NTRU-IBRS在车辆交互期间能够同时保证隐私安全和提高通信效率。

基于云服务器的公平多方隐私集合交集协议

张静, 田贺, 熊坤, 汤永利, 杨丽

2023, 43(9): 2806-2811. DOI: 10.11772/j.issn.1001-9081.2022081229

摘要 ( )

HTML ( )

PDF (1675KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

隐私集合交集（PSI）是解决隐私信息共享的重要办法。针对现有的协议中参与方不能同时获取计算结果而导致的不公平性问题，提出一种基于云服务器的公平多方PSI协议。首先，利用哈希映射完成隐私信息的子份额在混淆布隆过滤器（GBF）中的存储；其次，为避免交互过程中各参与方集合元素索引值的泄露，协议结合不经意传输（OT）技术完成存储信息的份额置换；最后，通过云服务器进行逐位计算，并将结果同时返回各参与方，保证各参与方获取结果的公平性。协议的正确性和安全性分析表明，所提协议能够实现参与方获得交集结果的公平性，而且协议能够抵抗参与方与云服务器进行的合谋。性能分析表明，所提协议的计算复杂度和通信复杂度与参与方集合包含的元素总数无关；与多方隐私集合交集协议（MPSI）、实用多方恶意安全私有集合交集PSImple和隐私集合交集求和协议（PI-Sum）相比，在同等条件下，所提协议的存储开销、通信开销和运行时间更少。

CHAIN：基于重合支配的边缘计算节点放置算法

赵徐炎, 崔允贺, 蒋朝惠, 钱清, 申国伟, 郭春, 李显超

2023, 43(9): 2812-2818. DOI: 10.11772/j.issn.1001-9081.2022081250

摘要 ( )

HTML ( )

PDF (1484KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

边缘计算将计算资源部署在离终端用户更近的边缘计算节点，从待选的位置中选择合适的边缘计算节点部署位置能提升边缘计算服务的节点容量以及用户服务质量（QoS）。然而，目前对于如何放置边缘计算节点以降低边缘计算成本的研究较少。此外，在边缘服务的时延等QoS因素的约束下，目前尚没有一种边缘计算节点部署算法能最大限度地提高边缘服务的鲁棒性同时最小化边缘节点部署成本。针对上述问题，首先，通过建立计算节点、用户传输时延和鲁棒性的模型将边缘计算节点放置问题转化为带约束条件的最小支配集问题；随后，提出重合支配的概念，基于重合支配衡量网络鲁棒性，设计了基于重合支配的边缘计算节点放置算法——CHAIN（edge server plaCement algoritHm based on overlApping domINation）。仿真实验结果表明，与面向覆盖的近似算法和面向基站的随机算法相比，CHAIN的系统时延降低了50.54%与50.13%。

基于空间语义和个体活动的电动汽车充电站选址方法

郭茂祖, 张雅喆, 赵玲玲

2023, 43(9): 2819-2827. DOI: 10.11772/j.issn.1001-9081.2022091421

摘要 ( )

HTML ( )

PDF (6390KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对电动汽车充电站（EVCS）的选址问题，提出一种基于空间语义和个体活动模式的城市充电站选址方法。首先，根据城市规划，采用无监督学习对非服务半径内兴趣点（POI）进行聚类，以确定新建充电站个数；然后，采用受约束的双存档进化算法（CTAEA）求解目标函数，在站间距最大化以及新充电站覆盖POI最多的约束条件下优化电动汽车选址方案。以成都市二环路内出租车的轨迹数据和POI为实验样本，并规划了15个充电站的选址方案。实验结果表明，相较于NSGA2（Non-dominated Sorting Genetic Algorithm 2）和SPEA2（Strength Pareto Evolutionary Algorithm 2），CTAEA的POI覆盖率指标提高了22.9和20.6个百分点，司机平均选择距离缩短了18.9%和25.5%，验证了所提方法在电动汽车选址方面的便利性与合理性。

异构平台下卷积神经网络推理模型自适应划分和调度方法

尚绍法, 蒋林, 李远成, 朱筠

2023, 43(9): 2828-2835. DOI: 10.11772/j.issn.1001-9081.2022081177

摘要 ( )

HTML ( )

PDF (3025KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对卷积神经网络（CNN）在异构平台执行推理时存在硬件资源利用率低、延迟高等问题，提出一种CNN推理模型自适应划分和调度方法。首先，通过遍历计算图提取CNN的关键算子完成模型的自适应划分，增强调度策略灵活性；然后，基于性能实测与关键路径-贪婪搜索算法，在CPU-GPU异构平台上根据子模型运行特征选取最优运行负载，提高子模型推理速度；最后利用张量虚拟机（TVM）中跨设备调度机制，配置子模型的依赖关系与运行负载，实现模型推理的自适应调度，降低设备间通信延迟。实验结果表明，与TVM算子优化方法在GPU和CPU上的推理速度相比，所提方法在模型推理准确度无损前提下，推理速度提升了5.88%~19.05%和45.45%~311.46%。

基于张量虚拟机的深度神经网络模型加速方法

申云飞, 申飞, 李芳, 张俊

2023, 43(9): 2836-2844. DOI: 10.11772/j.issn.1001-9081.2022081259

摘要 ( )

HTML ( )

PDF (3331KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

随着人工智能（AI）技术的蓬勃发展，深度神经网络（DNN）模型被大规模应用到各类移动端与边缘端。然而，边缘端算力低、内存容量小，且实现模型加速需要深入掌握边缘端硬件知识，这增加了模型的部署难度，也限制了模型的推广应用。因此，基于张量虚拟机（TVM）提出一种DNN加速与部署方法，从而实现卷积神经网络（CNN）模型在现场可编程门阵列（FPGA）上的加速，并在分心驾驶分类应用场景下验证了所提方法的可行性。通过计算图优化方法减小了模型的访存和计算开销，通过模型量化方法减小了模型尺寸，通过计算图打包方法将卷积计算卸载到FPGA上执行以提高模型推理速度。与微处理器（MPU）相比，所提方法可使ResNet50和ResNet18在MPU+FPGA上的推理时间分别减少88.63%和77.53%；而在AUC（American University in Cairo）数据集上，相较于MPU，两个模型在MPU+FPGA上的top1推理精度仅下降了0.26和0.16个百分点。可见，所提方法可以降低不同模型在FPGA上的部署难度。

基于多个改进策略的增强麻雀搜索算法

李大海, 詹美欣, 王振东

2023, 43(9): 2845-2854. DOI: 10.11772/j.issn.1001-9081.2022081270

摘要 ( )

HTML ( )

PDF (4003KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对麻雀搜索算法（SSA）存在寻优精度不高且易陷入局部最优的问题，提出一种基于多个改进策略的增强麻雀搜索算法（EMISSA）。首先，为平衡算法的全局和局部搜索能力，引入模糊逻辑来动态调整麻雀发现者的规模；其次，对麻雀跟随者进行混合差分变异操作以产生变异子群，从而增强EMISSA跳出局部最优的能力；最后，通过拓扑对立学习（TOBL）产生当前麻雀发现者个体的拓扑对立解，以充分挖掘搜索空间内的优质位置信息。通过2013年进化计算大会（CEC2013）中的12个测试函数评估EMISSA、标准SSA以及混沌麻雀搜索优化算法（CSSOA）等改进麻雀算法的性能。实验结果表明，EMISSA在30维情况下，在12个测试函数上获得了11个第一；在80维情况下，在所有的测试函数上都获得了第一。而在Friedman检验中，EMISSA的排名均获得了第一。将EMISSA应用于障碍物环境下的无线传感器网络（WSN）节点部署，实验结果表明，相较于其他算法，EMISSA获得了最高的无线节点覆盖率，节点分布更均匀，覆盖冗余更少。

面向异构多背包问题的多级二进制帝国竞争算法

李斌, 唐志斌

2023, 43(9): 2855-2867. DOI: 10.11772/j.issn.1001-9081.2022081189

摘要 ( )

HTML ( )

PDF (2507KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在传统多背包问题的基础上，从典型物流服务场景中共性抽象出异构多背包问题（HMKP），并设计和定制了一种帝国竞争算法（ICA）对HMKP进行求解和评估。针对原始ICA易陷入局部最优以及0-1背包问题最优解往往在约束边界周围的特点，设计了双点自变异策略（TPAS）和跳出局部最优算法（JLOA）对ICA进行改进，提出面向0-1背包问题的二进制帝国竞争算法（BICA）。BICA在求解35个0-1背包问题算例时展现出了全面、高效的寻优能力，基于最佳匹配值法（BMV）的BICA在第一组测试集的20个算例上能对19个算例100%找到理想最优值，在第二组测试集的15个算例上能对12个算例100%找到理想最优值，在所有对比算法中表现最优。数值结果分析表明，BICA在寻优演化中维持多极发展策略，并依托独特的种群进化方式在解空间中高效搜索理想解。在此基础上，针对HMKP强约束性和高复杂度的特性，基于BICA设计了求解HMKP的多级二进制帝国竞争算法（MLB-ICA）。分别在多个典型0-1背包问题算例组合构建的HMKP高维测试集上进行了MLB-ICA的数值实验和性能评估，结果表明虽然MLB-ICA的求解时间比Gurobi长，但求解精度提高了28%。可见，MLB-ICA能以较低的计算代价在可接受的时间范围内高效求解高维复杂的HMKP，为ICA在超大规模组合优化问题中的求解提出了可行的算法设计方案。

基于亚群和差分进化的混合蜻蜓算法

王波, 王浩, 杜晓昕, 郑晓东, 周薇

2023, 43(9): 2868-2876. DOI: 10.11772/j.issn.1001-9081.2022060813

摘要 ( )

HTML ( )

PDF (2338KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对蜻蜓算法（DA）存在开发能力弱、种群多样性低、易过早收敛至局部最优等问题，提出一种基于亚群和差分进化的混合蜻蜓算法（HDASDE）。首先，对基本蜻蜓算法进行改进：融入混沌因子和有目的的莱维飞行来提升蜻蜓算法的寻优能力，并提出混沌跃迁机制加强基本蜻蜓算法的勘探能力；其次，在差分进化（DE）算法的基础上引入反向学习加强DE算法的开发能力；再次，利用亚群策略提高算法跳出局部最优的能力，设计了一种动态双亚群策略将整个种群划分为动态变化的两个亚群；然后使用动态亚群结构将改进蜻蜓算法和改进DE算法进行融合，融合后的算法具有较好的全局勘探能力以及较强的局部开发能力。最后，将HDASDE应用于13个典型的复杂函数优化问题和三杆桁架的设计优化问题，并与原始的DA、DE算法以及其他元启发式优化算法进行对比。实验结果表明，HDASDE在所有13个测试函数中优于DA、DE、人工蜂群（ABC）算法；在12个测试函数中优于粒子群优化（PSO）算法；在10个测试函数中优于灰狼优化（GWO）算法。并且，在三杆桁架的设计优化问题中效果较好。

无线视频传感器网络β-QoM目标栅栏覆盖构建算法

郭新明, 刘蕊, 谢飞, 林德钰

2023, 43(9): 2877-2884. DOI: 10.11772/j.issn.1001-9081.2023010084

摘要 ( )

HTML ( )

PDF (4482KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对传统无线视频传感器网络（WVSN）目标栅栏因捕获图像宽度过小而导致的入侵检测失效问题，提出一个能确保捕获不小于β监测质量（β-QoM）的无线视频传感器网络β-QoM目标栅栏覆盖构建（WβTBC）算法。首先，建立视频传感器β-QoM区的几何模型，并证明了所有相邻视频传感器β-QoM区相交的目标栅栏捕获的入侵者图像宽度必大于等于β；然后，在对WVSN最优β-QoM目标栅栏覆盖建立线性规划模型的基础上，证明了它是一个NP-hard问题；最后，为了获得该问题的次优解，设计了一个启发式算法WβTBC。根据传感器间的逆时针β邻居关系建立WVSN的有向图，并采用Dijkstra算法在WVSN中搜索β-QoM目标栅栏。实验结果表明，WβTBC算法能有效构建β-QoM目标栅栏，且分别比螺旋外围外覆盖（SPOC）、螺旋外围内覆盖（SPIC）及目标栅栏构建（TBC）算法节省了23.3%、10.8%和14.8%的传感器节点。此外，在满足入侵检测要求的前提下，β值越小，WβTBC算法构建β-QoM目标栅栏的成功率越高，形成栅栏的节点越少，WVSN进行β-QoM入侵检测的工作周期越长。

非坚持型载波监听多路访问机制对LoRa网络扩展性的影响

万义程, 杨光祥, 张庆达, 甘晨阳, 易林

2023, 43(9): 2885-2896. DOI: 10.11772/j.issn.1001-9081.2022081237

摘要 ( )

HTML ( )

PDF (3616KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

LoRaWAN是低功耗广域网（LPWAN）中的一种无线通信标准，为物联网的发展提供了支撑。然而，受限于扩频因子（SF）间不完全正交性的特点和LoRaWAN不具备先听后发（LBT）机制的事实，基于ALOHA的传输调度方式会引发严重的信道冲突，极大降低了LoRa（Long Range Radio）网络的扩展性。为提高LoRa网络的扩展性，提出用非坚持型载波监听多路访问（NP-CSMA）机制替代LoRaWAN中ALOHA的介质访问控制机制，通过LBT协调LoRa网络中SF相同的各个节点接入信道的时间。不同SF之间的传输则采用多种SF信号并行传输，以减少共信道中同SF干扰和避免SF间干扰。为了分析NP-CSMA对LoRa网络扩展性的影响，通过理论分析和NS3仿真对LoRaWAN与NP-CSMA构建的LoRa网络进行比较。实验结果表明，在相同的条件下，与LoRaWAN相比，NP-CSMA在网络通信负载率为1的情况下，它的理论数据包交付率（PDR）性能比LoRaWAN高58.09%。在信道利用率方面，与LoRaWAN相比，NP-CSMA的饱和信道利用率提高了214.9%，容纳的节点数量也增加了60.0%。另外，NP-CSMA的平均时延在网络通信负载率小于1.7时也低于确认型LoRaWAN，而且在扩频因子为7和10时，它用于维持信道活动检测（CAD）模式所造成的额外能耗也比LoRaWAN用于接收来自网关确认消息所需的额外能耗低1.0~1.3 mJ和2.5~5.1 mJ；充分反映了NP-CSMA可以有效提高LoRa网络的可扩展性。

基于失焦模糊的焦点堆栈深度估计方法

周萌, 黄章进

2023, 43(9): 2897-2903. DOI: 10.11772/j.issn.1001-9081.2022091342

摘要 ( )

HTML ( )

PDF (3089KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有的单目深度估计方法通常使用图像语义信息来获取深度，忽略了另一个重要的线索——失焦模糊。同时，基于失焦模糊的深度估计方法通常把焦点堆栈或者梯度信息作为输入，没有考虑到焦点堆栈各图像层之间的模糊变化量小以及焦点平面两侧具有模糊歧义性的特点。针对现有焦点堆栈深度估计方法的不足，提出一种基于三维卷积的轻量化网络。首先，设计一个三维感知模块对焦点堆栈的模糊信息进行粗提取；然后，将提取到的信息与通道差分模块输出的焦点堆栈RGB通道差分特征进行级联，构建可以识别模糊歧义性模式的焦点体；最后，利用多尺度三维卷积来预测深度。实验结果表明，与AiFDepthNet（All in Focus Depth Network）等方法相比，所提方法在DefocusNet数据集上的平均绝对误差（MAE）等7个指标上取得了最优；在NYU Depth V2数据集上的4个指标上取得了最优，3个指标上取得了次优；同时，轻量化的设计使所提方法的推理时间分别缩短了43.92%~70.20%和47.91%~77.01%。可见，所提方法能有效地提高焦点堆栈深度估计的准确性及推理速度。

基于事件相机的雨滴检测算法

杨君宇, 董岩, 龙镇南, 杨新, 韩斌

2023, 43(9): 2904-2909. DOI: 10.11772/j.issn.1001-9081.2022091360

摘要 ( )

HTML ( )

PDF (1427KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

图像除雨算法一般对单帧图像或视频流中的雨滴进行去除，以降低雨滴对视觉任务的不良影响。然而，由于雨滴下落速度极快，基于帧的相机无法获取雨滴在时间上的连续性，且相机的曝光时间和运动模糊进一步降低了图像中雨滴的清晰度，导致传统图像的除雨算法无法准确检出雨滴覆盖区域。为探究图像除雨的新思路，利用事件相机极高采样率、无运动模糊的特性，分析并建立了雨滴事件生成模型，并提出了基于时空关联性的事件相机雨滴检测算法。该算法通过分析事件相机记录下的每个事件与相邻事件之间的时空关系来对每个事件产生自雨滴运动的概率进行计算，从而实现雨滴检测。在三种降雨场景上的实验结果表明，在相机静止不动时，所提算法的雨滴检测正确率可达95%以上，误检率低于5%；当相机处于运动状态时，所提算法仍可达到95%以上的正确率与不超过20%的误检率。说明所提算法可有效检出雨滴。

用于语音检索的三联体深度哈希方法

张秋余, 温永旺

2023, 43(9): 2910-2918. DOI: 10.11772/j.issn.1001-9081.2022081149

摘要 ( )

HTML ( )

PDF (2003KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现有基于内容的语音检索中深度哈希方法对监督信息利用不足，生成的哈希码是次优的，而且检索精度和检索效率不高。针对以上问题，提出一种用于语音检索的三联体深度哈希方法。首先，将语谱图图像特征以三联体方式作为模型的输入来提取语音特征的有效信息；然后，提出注意力机制-残差网络（ARN）模型，即在残差网络（ResNet）的基础上嵌入空间注意力力机制，并通过聚集整个语谱图能量显著区域信息来提高显著区域表示；最后，引入新三联体交叉熵损失，将语谱图图像特征之间的分类信息和相似性映射到所学习的哈希码中，可在模型训练的同时实现最大的类可分性和最大的哈希码可分性。实验结果表明，所提方法生成的高效紧凑的二值哈希码使语音检索的查全率、查准率、F1分数均超过了98.5%。与单标签检索等方法相比，使用Log-Mel谱图作为特征的所提方法的平均运行时间缩短了19.0%~55.5%，能在减小计算量的同时，显著提高检索效率和精度。

基于多尺度特征提取与融合的图像复制-粘贴伪造检测

陈俊韬, 朱子奇

2023, 43(9): 2919-2924. DOI: 10.11772/j.issn.1001-9081.2022081288

摘要 ( )

HTML ( )

PDF (1303KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在图像复制-粘贴伪造检测领域，精确地定位被篡改的小目标的边界充满挑战性。当前基于深度学习的方法通过检测图像中的相似内容来定位伪造区域，然而它们通常只是把编码器最终提取的特征传递给解码器来生成掩码，忽略了高分辨率的编码特征所包含的更多的伪造区域的空间信息，这会导致模型输出的预测结果对于小目标的边界识别不精确。针对这个问题，提出一种基于多尺度特征提取与融合的检测网络SimiNet。首先，使用多尺度特征提取模块提取丰富的特征；其次，在特征提取模块与解码模块之间添加跳跃连接以弥补编码特征与解码特征之间的差异，从而精确地识别小目标的边界；最后，用Log-Cosh Dice Loss函数替代交叉熵损失，以降低类别不平衡问题对检测结果的影响。实验结果表明，SimiNet在USCISI数据集上的F1分数达到72.54%，比次优方法CMSDNet（Copy-Move Similarity Detection Network）提升了3.39个百分点。可见，SimiNet对小目标的边界识别更精确，可视化效果更好。

基于残差反馈和自注意力的图像篡改取证网络

袁国龙, 张玉金, 刘洋

2023, 43(9): 2925-2931. DOI: 10.11772/j.issn.1001-9081.2022081283

摘要 ( )

HTML ( )

PDF (1998KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

现存的使用噪声特征的多篡改类型图像伪造检测算法，往往不能有效地检测篡改区域和非篡改区域之间的特征差异，特别是对复制-粘贴篡改类型。为此，提出一种融合残差反馈和自注意力机制的双流编-解码器图像篡改取证网络，通过两个流分别检测RGB像素的非自然边缘等篡改伪影和局部噪声不一致性。首先，在编码器阶段使用多个融合残差反馈的双重残差单元提取相关篡改特征，以获得粗特征图；其次，通过改进后的自注意力机制对粗特征图进行进一步特征增强；随后，将互相对应的编码器浅层特征和解码器深层特征进行融合；最后，串联融合两个流最终提取到的篡改特征，再通过一个特殊卷积操作实现对篡改区域的像素级定位。实验结果表明，所提网络在COVERAGE数据集上的F1值和曲线下面积（AUC）优于对比网络。在NIST16、Columbia数据集上，所提网络的F1值相较于TED-Net（Two-stream Encoder-Decoder Network）分别提高了9.8和7.7个百分点，AUC分别提高了1.1和6.5个百分点。所提网络在复制-粘贴篡改类型检测上取得了良好的效果，并且也适用于其他篡改类型检测。同时，该网络能在像素级上对篡改区域准确定位，检测性能优于对比网络。

基于一致性训练的半监督虚假招聘广告检测模型

王瑞琪, 纪淑娟, 曹宁, 郭亚杰

2023, 43(9): 2932-2939. DOI: 10.11772/j.issn.1001-9081.2022081163

摘要 ( )

HTML ( )

PDF (2191KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

虚假招聘广告的泛滥不仅会损害求职者的合法权益，还会扰乱正常的就业秩序，造成求职者极差的用户体验。为了有效检测出虚假招聘广告，提出一种基于一致性训练的半监督虚假招聘广告检测模型（SSC）。首先，对所有数据应用一致性正则项提升模型的性能；然后，通过联合训练的方式整合有监督损失和无监督损失得到半监督损失；最后，使用半监督损失对模型进行优化。在两个真实数据集EMSCAD （EMployment SCam Aegean Dataset）和IMDB （Internet Movie DataBase）上的实验结果表明，SSC在标签数据仅为20时取得了最好的检测效果，准确率与现有先进的半监督学习模型UDA （Unsupervised Data Augmentation）相比提升了2.2和2.8个百分点，与深度学习模型BERT （Bidirectional Encoder Representations from Transformers）相比提升了3.4和11.7个百分点，同时还具有较好的可拓展性。

基于空洞卷积的医学图像超分辨率重建算法

李众, 王雅婧, 马巧梅

2023, 43(9): 2940-2947. DOI: 10.11772/j.issn.1001-9081.2023030381

摘要 ( )

HTML ( )

PDF (3298KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

为解决现有医学图像超分辨率重建中存在的图像细节模糊、全局信息利用不充分等问题，提出一种基于空洞卷积与改进的混合注意力机制的医学图像超分辨率重建算法。首先，将深度可分离卷积与空洞卷积相结合，使用不同大小的感受野对图像进行不同尺度的特征提取，从而增强特征表达能力；其次，引入边缘通道注意力机制，在提取图像高频特征的同时融合边缘信息，从而提高模型的重建精度；再次，混合L1损失与感知损失函数作为整体损失函数，使重建后的图像效果更符合人类视觉感观。实验结果表明，在放大因子为3时，与基于卷积神经网络的图像超分辨率（SRCNN）算法、VDSR（Very Deep convolutional networks Super-Resolution）相比，所提算法的峰值信噪比（PSNR）平均提高了11.29%与7.85%；结构相似性（SSIM）平均提高了5.25%和2.44%。可见，所提算法能增强医学图像的效果与纹理特征，且对图像整体结构还原更加完整。

基于融合通道注意力的Uformer的CT图像稀疏重建

陈蒙蒙, 乔志伟

2023, 43(9): 2948-2954. DOI: 10.11772/j.issn.1001-9081.2022081242

摘要 ( )

HTML ( )

PDF (5664KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对解析法稀疏重建中产生的条状伪影问题，提出一种融合通道注意力的U型Transformer（CA-Uformer），以实现高精度计算机断层成像（CT）的稀疏重建。CA-Uformer融合了通道注意力和Transformer中的空间注意力，双注意力机制使网络更容易学习到图像细节信息；采用优秀的U型架构融合多尺度图像信息；采用卷积操作实现前向反馈网络设计，从而进一步耦合卷积神经网络（CNN）的局部信息关联能力和Transformer的全局信息捕捉能力。实验结果表明，与经典U-Net相比，CA-Uformer的峰值信噪比（PSNR）、结构相似性（SSIM）提高了3.27 dB、3.14%，均方根误差（RMSE）降低了35.29%，提升效果明显。可见，CA-Uformer稀疏重建精度更高，压制伪影能力更强。

基于EfficientNetV2和物体上下文表示的胃癌图像分割方法

周迪, 张自力, 陈佳, 胡新荣, 何儒汉, 张俊

2023, 43(9): 2955-2962. DOI: 10.11772/j.issn.1001-9081.2022081159

摘要 ( )

HTML ( )

PDF (4902KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

针对U-Net上采样过程容易丢失细节信息，以及胃癌病理图像数据集普遍偏小，容易出现过拟合的问题，提出一种基于改进U-Net的自动分割胃癌病理图像模型EOU-Net。EOU-Net在U-Net模型的基础上，将EfficientNetV2作为骨干特征提取网络，以增强网络编码器的特征提取能力。在解码阶段，基于物体上下文表示（OCR）探究细胞像素间的关系，并使用改进后的OCR模块解决上采样图像的细节丢失问题；然后，使用验证阶段增强（TTA）后处理对输入图像进行翻转和不同角度旋转后分别预测这些图像，再通过特征融合的方式将多个输入图像预测结果进行合并，进一步优化网络的输出结果，从而有效解决医学数据集较小的问题。在SEED、BOT以及PASCAL VOC 2012数据集上的实验结果表明，与OCRNet相比，EOU-Net的平均交并比（MIoU）分别提高了1.8、0.6以及4.5个百分点。可见EOU-Net能得到更准确的胃癌图像分割结果。

融合卷积神经网络的遥感图像全色锐化

路琨婷, 费蓉蓉, 张选德

2023, 43(9): 2963-2969. DOI: 10.11772/j.issn.1001-9081.2022091458

摘要 ( )

HTML ( )

PDF (3323KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

在遥感图像全色锐化中，传统的成分替换（CS）和多分辨率分析（MRA）方法的线性注入模型没有考虑用于全色锐化传感器的相对光谱响应，而基于深度学习的方法对原图像特征的提取不足会导致融合结果中的光谱和空间信息的丢失。针对以上问题，提出一种结合传统与深度学习方法的全色锐化方法CMRNet。首先，将CS和MRA与卷积神经网络（CNN）相结合以实现非线性从而提高全色锐化方法性能；其次，设计残差通道（RC）块实现多尺度特征信息的融合提取，并利用通道注意力（CA）自适应地为不同通道的特征图分配不同的权值，从而学习更有效的信息。在QuickBird和GF1卫星数据集上对CMRNet进行训练和测试，实验结果表明，在降尺度QuickBird和GF1数据集上，与经典方法PanNet相比，CMRNet的峰值信噪比（PSNR）分别提高了5.48%和9.62%，其他指标也均有显著提高。可见，CMRNet能实现较好的全色锐化效果。

基于机器视觉的水产养殖计数研究综述

张涵钰, 李振波, 李蔚然, 杨普

2023, 43(9): 2970-2982. DOI: 10.11772/j.issn.1001-9081.2022081261

摘要 ( )

HTML ( )

PDF (1320KB) ( )

数据和表 | 参考文献 | 相关文章 | 计量指标

养殖计数是水产养殖过程中的重要环节，计数结果为水产动物的饲料投喂、养殖密度调整和经济效益估算等方面提供重要依据。针对传统人工计数方法耗时费力且易造成较大误差的问题，大量基于机器视觉的方法与应用被提出，极大地推动了水产品无损计数的发展。为深入了解基于机器视觉的水产养殖计数研究，整理和分析了至今三十多年来国内外的相关文献。首先，从数据采集方面对水产养殖计数展开综述性介绍，并对机器视觉所需数据的获取方法进行概括；其次，从传统机器视觉和深度学习两方面对水产养殖计数方法进行分析与总结；然后，对各种计数方法在不同养殖环境的实际应用进行对比分析；最后，从数据、方法和应用三方面总结了水产养殖计数研究的发展难点，并提出了计数方法研究和装备应用的未来发展方向。

当期目录