检索结果

Select

1. 基于YOLOv5s的复杂场景下高效烟火检测算法YOLOv5s-MRD

侯阳, 张琼, 赵紫煊, 朱正宇, 张晓博

《计算机应用》唯一官方网站 2025, 45 (4): 1317-1324. DOI: 10.11772/j.issn.1001-9081.2024040527

摘要（99）

HTML （6）

PDF （4304KB）（70）

现有的烟火检测方法主要依赖员工现场巡视，效率低且实时性差，因此，提出一种基于YOLOv5s的复杂场景下的高效烟火检测算法YOLOv5s-MRD （YOLOv5s-MPDIoU-RevCol-Dyhead）。首先，采用MPDIoU （Maximized Position-Dependent Intersection over Union）方法改进边框损失函数，以适应重叠或非重叠的边界框回归（BBR），从而提高BBR的准确性和效率；其次，利用可逆柱状结构RevCol（Reversible Column）网络模型思想重构YOLOv5s模型的主干网络，使它具有多柱状网络架构，并在模型的不同层之间加入可逆链接，从而最大限度地保持特征信息以提高网络的特征提取能力；最后，引入Dynamic head检测头，以统一尺度感知、空间感知和任务感知，从而在不额外增加计算开销的条件下显著提高目标检测头的准确性和有效性。实验结果表明：在DFS（Data of Fire and Smoke）数据集上，与原始YOLOv5s算法相比，所提算法的平均精度均值（mAP@0.5）提升了9.3%，预测准确率提升了6.6%，召回率提升了13.8%。可见，所提算法能满足当前烟火检测应用场景的要求。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 引入解耦残差自注意力的边界交叉监督语义分割网络

姜坤元, 李小霞, 王利, 曹耀丹, 张晓强, 丁楠, 周颖玥

《计算机应用》唯一官方网站 2025, 45 (4): 1120-1129. DOI: 10.11772/j.issn.1001-9081.2024040415

摘要（58）

HTML （5）

PDF （4007KB）（21）

针对内镜语义分割网络中病灶边缘信息丢失和大面积病灶分割不全的问题，提出一种引入解耦残差自注意力（DRA）的边界交叉监督语义分割网络（BCS-SegNet）。首先，引入DRA，以增强网络对远距离关联性病灶的学习能力；其次，构建跨级交叉融合（CLF）模块，从而将编码结构中的多级特征图逐对组合，进而实现在低计算成本下图像细节与语义信息的融合；最后，使用多方向多尺度的二维Gabor变换提取边缘信息，并使用空间注意力加权特征图中的边缘特征，以监督分割网络的解码过程，从而在像素级别上提供更精准的类内分割一致性。实验结果表明，在ISIC2018皮肤镜和Kvasir-SEG/CVC-ClinicDB结肠镜数据集上，BCS-SegNet的平均交并比（mIoU）和Dice系数分别为84.27%、90.68%和79.24%、87.91%；在自建食管内镜数据集上，BCS-SegNet的mIoU和Dice系数分别为82.73%和90.84%，mIoU相较于U-net和UCTransNet分别提升了3.30%和4.97%。可见，所提网络可以达到更完整的分割区域和更清晰的边缘细节等视觉效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于工业云存储系统的数据防篡改批量审计方案

张晓均, 郝云溥, 李磊, 李晨阳, 周子玉

《计算机应用》唯一官方网站 2025, 45 (3): 891-895. DOI: 10.11772/j.issn.1001-9081.2024030349

摘要（45）

HTML （1）

PDF （1386KB）（11）

为解决工业云存储系统数据遭受篡改等网络主动攻击问题，实现工业数据云端安全共享的目标，并确保工业数据传输与存储过程的机密性、完整性与可用性，提出基于工业云存储系统的数据防篡改批量审计方案。在该方案中，设计基于双线性对映射的同态数字签名算法，使第三方审计者实现对工业云存储系统数据的批量防篡改完整性检测，并及时将防篡改完整性审计结果反馈给工程服务终端用户；此外，通过加入审计者减轻工程服务终端用户的计算负担，同时确保工业加密数据在传输与存储过程中的完整性。安全性分析与性能比较结果表明，所提方案通过设计防篡改检测向量，使得第三方审计者的计算量从O（n）次双线性对操作减少到O（1）次常量级双线性对操作，极大地降低了第三方审计者的计算开销。可见，所提方案适用于需要对大量工业云存储系统核心数据文件进行防篡改检测的轻量级批量审计场景。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于正态逆伽马分布的多尺度融合人群计数算法

李伟, 张晓蓉, 陈鹏, 李清, 张长青

《计算机应用》唯一官方网站 2024, 44 (7): 2243-2249. DOI: 10.11772/j.issn.1001-9081.2023060782

摘要（204）

HTML （7）

PDF （2793KB）（167）

针对人群分析任务中往往存在的因监控与人群距离不同而导致的尺度变化大的问题，提出一种基于正态逆伽马分布的多尺度融合人群计数算法MSF（Multi-Scale Fusion crowd counting）。首先，使用传统骨架提取公共特征，通过多尺度信息提取模块获得图像中不同尺度的行人信息；其次，每个尺度的网络各自包含一个人群密度估计模块和一个用于评估每个尺度预测结果可信度的不确定估计模块；最后，多尺度预测融合模块依据可信度对多尺度预测结果进行动态融合，以获得更准确的密度回归结果。实验结果表明，现有算法密集场景识别网络（CSRNet）在通过多尺度可信融合扩展后，在UCF-QNRF数据集上人群计数的平均绝对误差（MAE）和均方误差（MSE）分别减小了4.43%和1.37%，验证了MSF算法的合理性和有效性。此外，与现有算法不同，MSF算法不仅可以预测人群密度，还可以在部署阶段提供预测的可信程度，从而使算法在实际应用中能及时预警模型预测不准确的区域，降低后续分析任务出现错误预判的风险。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 基于个性化学习和深层次细化的知识追踪

李林昊, 张晓倩, 董瑶, 王旭, 董永峰

《计算机应用》唯一官方网站 2024, 44 (10): 3039-3046. DOI: 10.11772/j.issn.1001-9081.2023101452

摘要（126）

HTML （7）

PDF （2200KB）（60）

针对知识追踪（KT）模型没有充分考虑学生间差异、挖掘知识状态与习题的高度匹配等问题，提出一种双层网络架构——基于个性化学习和深层次细化的知识追踪（PLDRKT）。首先，利用增强注意力机制得到习题的深层次细化表示；其次，从不同学生对习题的难度感知和学习收益方面对初步知识状态进行个性化建模；最后，利用初步知识状态和深层习题表示得到学生的深层次知识状态并预测他们的未来答题情况。将PLDRKT模型与基于对抗训练的增强知识追踪（ATKT）和集成知识追踪（ENKT）等7种模型在Statics2011、ASSIST09、ASSIST15和ASSIST17数据集上进行对比实验。实验结果显示，PLDRKT模型的曲线下面积（AUC）均有增加，在4个数据集上与不考虑习题嵌入的最优基线模型相比，分别增加了0.61、1.32、5.29和0.19个百分点，可见PLDRKT模型可以较好地建模学生知识状态并预测回答。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 基于多尺度特征融合和网格注意力机制的三维肝脏影像分割方法

郑帅, 张晓龙, 邓鹤, 任宏伟

《计算机应用》唯一官方网站 2023, 43 (7): 2303-2310. DOI: 10.11772/j.issn.1001-9081.2022060803

摘要（378）

HTML （17）

PDF （2868KB）（390）

在计算机断层扫描（CT）和磁共振成像（MRI）的影像中肝脏与邻近脏器的灰度值相似性都比较高，为自动精确地分割肝脏，提出一种基于多尺度特征融合和网格注意力机制的三维肝脏影像分割方法MAGNet （Multi-scale feature fusion And Grid attention mechanism Network）。首先，通过注意力引导连接模块来连接高层特征和低层特征以提取出重要的上下文信息，并且在注意力引导连接模块中引入网格注意力机制来关注感兴趣的分割区域；然后，通过在单个特征图中按通道数进行分层连接形成多尺度特征融合模块，并用该模块替换基础卷积块以获取多尺度语义信息；最后，利用深度监督机制解决梯度消失、梯度爆炸和收敛过慢等问题。实验结果表明：在3DIRCADb数据集上，与U³-Net+DC方法相比，MAGNet在Dice相似系数（DSC）指标上提升了0.10个百分点，在相对体积差（RVD）指标上降低了1.97个百分点；在Sliver07数据集上，与CANet方法相比，MAGNet在DSC指标上提升了0.30个百分点，在体素重叠误差（VOE）指标上降低了0.68个百分点，在平均对称表面距离（ASD）和对称位置表面距离的均方根（RMSD）指标上分别降低了0.03 mm和0.22 mm；在某医院肝脏MRI数据集上，MAGNet在所有指标上也均具有良好的结果。另外，将MAGNet应用于3DIRCADb数据集和某医院肝脏MRI数据集进行混合形成的数据集，也取得了非常有竞争力的分割效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

7. 属性聚类下三支概念的对比

张晓燕, 王佳一

《计算机应用》唯一官方网站 2023, 43 (5): 1336-1341. DOI: 10.11772/j.issn.1001-9081.2022030399

摘要（295）

HTML （19）

PDF （471KB）（144）

三支概念分析是人工智能领域一个非常重要的研究方向，该理论最大的优势是可以同时研究形式背景中对象“共同具有”和“共同不具有”的属性。众所周知，经过属性聚类生成的新形式背景与原形式背景具有较强的联系，同时原三支概念与经过属性聚类得到的新三支概念也存在紧密的内在联系。为此，进行属性聚类下三支概念的对比研究和分析。首先基于属性聚类提出悲观属性聚类、乐观属性聚类以及一般属性聚类的概念，并研究了这三种属性聚类的关系；然后，通过对比聚类过程与三支概念形成的过程，研究了原三支概念与新三支概念的区别，分别从面向对象和面向属性的角度提出两个最低约束指数，探索了属性聚类对三支概念格的影响，进一步丰富了三支概念分析理论，为可视化数据处理领域提供了可行的思路。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

8. 流密码非线性布尔函数可重构运算单元设计方法RA-NLBF

张宗仁, 戴紫彬, 刘燕江, 张晓磊

《计算机应用》唯一官方网站 2023, 43 (11): 3527-3533. DOI: 10.11772/j.issn.1001-9081.2022111690

摘要（211）

HTML （4）

PDF （1594KB）（186）

分组密码中的S盒（多输出）以及流密码中的反馈函数都需要特殊的布尔函数来保证密码算法的安全性。为解决现有流密码算法中非线性布尔函数（NLBF）可重构硬件运算单元资源占用过大、时钟频率低等问题，提出一种高效的基于与非锥（AIC）的NLBF可重构运算单元设计方法（RA-NLBF）。以密码学理论为基础，在着重分析多种流密码算法的NLBF特性，提取了涵盖与项次数、与项个数、输入端口数等NLBF函数特征的基础上，提出基于“混合极性Reed-Muller（MPRM）”和“传统布尔逻辑（TB）”双逻辑混合形式的NLBF化简方法，NLBF的与项数量减少29%，形成了适用于AIC的NLBF表达式；根据化简后的表达中与项个数、与项次数分布等特征，设计了可重构AIC单元和互联网络，形成可满足现有公开流密码算法中的NLBF运算的可重构单元。基于CMOS 180 nm工艺对提出的RA-NLBF进行逻辑综合验证，结果显示该方法的面积为12 949.67 μm2，时钟频率达到505 MHz，与现有相同功能的单元可重构序列密码逻辑单元（RSCLU）相比，面积减少了59.7%，时钟频率提高了37.3%。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

9. 基于先验知识的非负矩阵半可解释三因子分解算法

陈露, 张晓霞, 于洪

《计算机应用》唯一官方网站 2022, 42 (3): 671-675. DOI: 10.11772/j.issn.1001-9081.2021040927

摘要（548）

HTML （27）

PDF （600KB）（494）

非负矩阵三因子分解是潜在因子模型中的重要组成部分，由于能将原始数据矩阵分解为三个相互约束的潜因子矩阵，被广泛应用于推荐系统、迁移学习等研究领域，但目前还没有非负矩阵三因子分解的可解释性方面的研究工作。鉴于此，将用户评论文本信息当作先验知识，设计了一种基于先验知识的非负矩阵半可解释三因子分解（PE-NMTF）算法。首先利用情感分析技术提取用户评论文本信息的情感极性偏好；然后更改了非负矩阵三因子分解算法的目标函数和更新公式，巧妙地将先验知识嵌入到算法中；最后在推荐系统冷启动任务的Yelp和Amazon数据集以及图像零次识别任务的AwA和CUB数据集上与非负矩阵分解、非负矩阵三因子分解算法做了大量对比实验，实验结果表明所提算法在均方根误差（RMSE）、归一化折损累计增益（NDCG）、归一化互信息（NMI）和准确率（ACC）上都表现优异，且利用先验知识进行非负矩阵三因子分解的解释具有可行性和有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

10. 基于生成对抗网络的事件描述生成

孙鹤立, 孙玉柱, 张晓云

计算机应用 2021, 41 (5): 1256-1261. DOI: 10.11772/j.issn.1001-9081.2020081242

摘要（441）

PDF （971KB）（846）

在基于事件的社会网络（EBSN）中，自动生成社交事件（Social Event）的事件描述（Event Description）供组织者参考，从而有效避免描述贫乏、描述过度、精准度低的问题，易于形成丰富、准确、高吸引力的事件描述。为了自动生成与真实事件描述足够相似的文本，提出了一种生成对抗网络（GAN）模型GAN_PG来生成事件描述。GAN_PG模型中的生成模型（Generator）采用变分自编码器（VAE），判别模型（Discriminator）采用带门控循环单元（GRU）的神经网络。模型训练时借鉴了强化学习中的策略梯度（PG）下降，并通过设计合理的奖励函数来训练生成器生成事件描述。实验结果表明，设计的模型生成事件描述的BLEU-4值达到了0.67，证明了提出的事件描述生成模型GAN_PG可以无监督地产生与自然语言足够相似的事件描述。

参考文献 | 相关文章 | 多维度评价

Select

11. 基于HHT-MFCC和短时能量的慢性阻塞性肺病患者呼吸声识别

常峥, 罗萍, 杨波, 张晓晓

计算机应用 2021, 41 (2): 598-603. DOI: 10.11772/j.issn.1001-9081.2020060881

摘要（499）

PDF （1298KB）（739）

为了优化梅尔频率倒谱系数（MFCC）特征提取算法，提高对呼吸声信号识别的准确率，实现识别慢性阻塞性肺病（COPD）的目的，提出了基于希尔伯特黄变换（HHT）的MFCC与短时能量（Energy）融合的特征提取算法HHT-MFCC+Energy。首先，经预处理的呼吸声信号通过HHT计算出Hilbert边际谱和边际谱能量；其次，谱能量通过Mel滤波器得到特征向量，再对特征向量取对数和进行离散余弦变换得到HHT-MFCC系数；最后，将信号的短时能量与HHT-MFCC特征向量融合形成新特征，并通过支持向量机（SVM）进行信号识别。将MFCC、HHT-MFCC和HHT-MFCC+Energy三种特征提取算法结合SVM进行呼吸声信号识别，实验结果表明，所提出的特征融合算法在COPD患者和健康人呼吸声识别效果上都优于其他两种算法：当提取24维特征、选取100个训练样本时，识别率平均值能达到97.8%，分别比MFCC和HHT-MFCC高出6.9个百分点和1.4个百分点。

参考文献 | 相关文章 | 多维度评价

Select

12. 基于边缘关注模型的语义分割方法

佘玉龙, 张晓龙, 程若勤, 邓春华

计算机应用 2021, 41 (2): 343-349. DOI: 10.11772/j.issn.1001-9081.2020050725

摘要（596）

PDF （1372KB）（750）

肝脏是人体代谢功能的主要器官，目前机器学习在肝脏影像语义分割研究中的难点有：1）肝脏中间部位有下腔静脉、软组织和血管，甚至有坏死或肝裂等情况；2）肝脏与一些邻近器官之间的边界模糊，难以分辨。针对这些问题，提出了边缘关注模型（EAM）及边缘关注网络（EANet）。该网络采用了Encoder-Decoder（编码-解码）的模型框架：在编码器中运用了在ImageNet上预训练好的残差网络ResNet34和EAM，由此来充分获取肝脏边缘的细节特征信息；在解码器中则运用了反卷积操作和EAM对有效信息进行特征提取，进而得到肝脏影像的语义分割图。最后，对分割后噪声较大的图片实施了平滑处理。在三个数据集上与AHCNet进行对比，结果显示：在3Dircadb数据集上，EANet的体积重叠误差（VOE）和相对体积差异（RVD）分别降低了1.95个百分点和0.11个百分点，且DICE精度提高了1.58个百分点；在Sliver07数据集上，EANet的VOE、最大表面距离（MSD）和均方差对称表面距离（RMSD）分别降低了大约1个百分点、3.3 mm和0.2 mm；在某医院临床MRI肝脏影像数据集上，EANet的VOE和RVD分别降低了0.88个百分点和0.31个百分点，且DICE精度提高了1.48个百分点。实验结果表明，所提出的EANet具有较好的肝脏图像分割效果。

参考文献 | 相关文章 | 多维度评价

Select

13. 动态融合社交信息的社会化推荐

任柯舟, 彭甫镕, 郭鑫, 王喆, 张晓静

计算机应用 2021, 41 (10): 2806-2812. DOI: 10.11772/j.issn.1001-9081.2020111892

摘要（459）

PDF （728KB）（643）

针对推荐算法中的数据稀疏问题，通常引入社交数据作为辅助信息进行社会化推荐。传统的社会化推荐算法忽略用户的兴趣迁移，导致模型无法描述用户兴趣的动态变化特征，也忽略了社交影响的动态特性，导致模型将很久以前的社交行为与近期社交行为同等对待。针对这两点提出一种社交信息动态融合的社会化推荐模型SLSRec。首先，利用自注意力机制构建用户交互物品的序列模型，以实现对用户兴趣的动态描述；然后，设计具有时间遗忘的注意力机制对社交短期兴趣进行建模，并设计具有协同特性的注意力机制对社交长期兴趣进行建模；最后，融合社交的长短期兴趣与用户的短期兴趣来获得用户的最终兴趣并产生下一项推荐。利用归一化折损累计增益（NDCG）和命中率（HR）指标在稀疏数据集brightkite和稠密数据集Last.FM上把所提模型与序列推荐模型（自注意力序列推荐（SASRec）模型）和社会化推荐模型（社会推荐的神经影响扩散（DiffNet）模型）进行对比验证。实验结果显示，SLSRec模型与DiffNet模型相比，在稀疏数据集上的HR指标提升了8.5%；与SASRec模型相比，在稠密数据集上的NDCG指标提升了2.1%，表明考虑社交信息的动态特性使推荐结果更加准确。

参考文献 | 相关文章 | 多维度评价

Select

14. 基于经验模态分解和长短期记忆神经网络的短期交通流量预测

张晓晗, 冯爱民

计算机应用 2021, 41 (1): 225-230. DOI: 10.11772/j.issn.1001-9081.2020060919

摘要（599）

PDF （1687KB）（778）

交通流量预测作为智能交通的重要一环，所要处理的交通数据具有非线性、周期性和随机性的特点，导致在数据预测时，不稳定的交通流量数据依赖于长期数据范围，且由于一些外部因素使得原始数常包含一些噪声，可能导致预测性能的进一步下降。针对上述问题提出了一种能够去噪且能处理长时依赖的预测算法——EMD-LSTM。首先，通过经验模态分解（EMD）算法将交通时序数据中的不同尺度分量逐级分解出来，生成一系列具有相同特征尺度的本征模函数，从而去除一定的噪声影响；然后，借助长短期记忆（LSTM）神经网络解决数据的长期依赖问题，从而使所提算法在长时间视野预测方面表现更为突出。对实际数据集进行短期预测的实验结果表明，EMD-LSTM的平均绝对误差（MAE）比LSTM低了1.916 32，平均绝对百分误差（MAPE）比LSTM降低了4.645 45个百分点，可见所提出的混合模型使预测准确性得到显著提高，能够有效解决交通数据的问题。

参考文献 | 相关文章 | 多维度评价

Select

15. 分布式存储系统中的日志分析与负载特征提取

苟子安, 张晓, 吴东南, 王艳秋

计算机应用 2020, 40 (9): 2586-2593. DOI: 10.11772/j.issn.1001-9081.2020010121

摘要（520）

PDF （1136KB）（787）

对运行在文件系统上的工作负载进行分析有助于优化分布式文件系统的性能，且对构建新型存储系统至关重要。由于工作负载的复杂性和规模多样性的增加，使用基于直觉的分析来显式地捕获工作负载踪迹的特征是不完备的。针对这一问题，提出了一个分布式日志分析与负载特征提取模型。首先，从分布式文件系统日志中根据关键字抽取出与读写相关的信息；其次，从统计与时序两方面对负载特征进行描述；最后，分析基于负载特征进行系统优化的可能。实验结果表明，提出的模型具有一定的可行性与准确性，且可以较为详细地给出负载统计与时序特征，具有低开销、高时效、易于分析等优点，可以用来指导具有相同特征的工作负载的合成、热点数据监测、系统的缓存预取优化。

参考文献 | 相关文章 | 多维度评价

Select

16. 基于多分支神经网络模型的弱监督细粒度图像分类方法

边小勇, 江沛龄, 赵敏, 丁胜, 张晓龙

计算机应用 2020, 40 (5): 1295-1300. DOI: 10.11772/j.issn.1001-9081.2019111883

摘要（572）

PDF （751KB）（735）

针对传统基于注意力机制的神经网络不能联合关注局部特征和旋转不变特征的问题，提出一种基于多分支神经网络模型的弱监督细粒度图像分类方法。首先，用轻量级类激活图(CAM)网络定位有潜在语义信息的局部区域，设计可变形卷积的残差网络ResNet-50和旋转不变编码的方向响应网络(ORN)；其次，利用预训练模型分别初始化特征网络，并输入原图和以上局部区域分别对模型进行微调；最后，组合三个分支内损失和分支间损失优化整个网络，对测试集进行分类预测。所提方法在CUB-200-2011和FGVC_Aircraft数据集上的分类准确率分别达到87.7%和90.8%，与多注意力卷积神经网络(MA-CNN)方法相比，分别提高了1.2个百分点和0.9个百分点；在Aircraft_2数据集上的分类准确率达到91.8%，比ResNet-50网络提高了4.1个百分点。实验结果表明，所提方法有效提高了弱监督细粒度图像分类的准确率。

参考文献 | 相关文章 | 多维度评价

Select

17. 基于扩张卷积的图像修复

冯浪, 张玲, 张晓龙

计算机应用 2020, 40 (3): 825-831. DOI: 10.11772/j.issn.1001-9081.2019081471

摘要（536）

PDF （1069KB）（669）

现有图像修复方法虽然能够补全图像缺失区域的内容，但是仍然存在结构扭曲、纹理模糊、内容不连贯等问题，无法满足人们视觉上的要求。针对这些问题，提出一种基于扩张卷积的图像修复方法，通过引入扩张卷积的思想增大感受野来提升图像修复的质量。该方法基于生成对抗网络（GAN）的思想，分为生成网络和对抗网络。生成网络包括全局内容修复网络和局部细节修复网络，并使用gated卷积动态地学习图像特征，解决了使用传统卷积神经网络方法无法较好地补全大面积不规则缺失区域的问题。首先利用全局内容修复网络获得一个初始的内容补全结果，之后再通过局部细节修复网络对局部纹理细节进行修复。对抗网络由SN-PatchGAN鉴别器构成，用于评判图像修复效果的好坏。实验结果表明，与目前存在的图像修复方法相比，该方法在峰值信噪比（PSNR）、结构相似性（SSIM）、inception分数3个指标上都有较大的提升；而且该方法有效解决了传统修复方法出现的纹理模糊问题，较好地满足了人们的视觉连贯性，证实了提出的方法的有效性和可行性。

参考文献 | 相关文章 | 多维度评价

Select

18. 基于新型存储器件的分布式文件系统性能优化

董聪, 张晓, 程文迪, 石佳

计算机应用 2020, 40 (12): 3594-3603. DOI: 10.11772/j.issn.1001-9081.2020050632

摘要（520）

PDF （1323KB）（603）

新型存储器件的I/O性能通常比传统固态驱动器（SSD）高一个数量级，然而使用新型存储器件的分布式文件系统相对于使用SSD的分布式文件系统性能并没有显著的提高，这说明目前的分布式文件系统并不能充分发挥新型存储器件的性能。针对这个问题，对Hadoop分布式文件系统（HDFS）的数据写入流程及传输过程进行了量化分析。通过量化分析HDFS数据写入过程各阶段的时间开销，发现在写入数据的各个阶段中，节点间数据传输的时间占比较大。因此提出了对应的优化方案，通过异步写入的方式并行化数据传输与处理过程，使得不同数据包的处理阶段叠加起来，减少了数据包整体的处理时间，从而提升了HDFS的写入性能。实验结果表明，所提方案将HDFS的写入吞吐量提升了15%~24%，总体的写入执行时间降低了28%~36%。

参考文献 | 相关文章 | 多维度评价

Select

19. 基于事件描述的社交事件参与度预测

孙鹤立, 孙玉柱, 张晓云

计算机应用 2020, 40 (11): 3101-3106. DOI: 10.11772/j.issn.1001-9081.2020030418

摘要（514）

PDF （676KB）（769）

在基于事件的社会网络（EBSNs）的相关研究中，基于事件描述来预测社交事件参与度是难点问题。相关的研究非常有限，研究难度主要来自对事件描述评价的主观性和语言建模算法的局限性。针对这些问题，首先定义了成功事件、相似事件和事件相似度等概念，并基于这些概念将采集自Meetup平台的社交数据进行抽取，同时分别设计了基于拉索回归、卷积神经网络（CNN）和门控循环神经网络（GRNN）的分析预测方法。实验时，先从抽取过的数据中选取部分数据训练三种模型，然后用剩余的数据进行分析预测。结果显示，相较于不含事件描述的事件，经过拉索回归模型处理的事件在不同分类器下的预测准确率可提高2.35%~3.8%，经过GRNN模型处理的事件在不同分类器下的预测准确率可提高4.5%~8.9%，而CNN模型的处理结果不理想。证明了事件描述能够提高事件参与度，GRNN模型在三个模型中预测准确率最高。

参考文献 | 相关文章 | 多维度评价

Select

20. 基于医疗文本数据聚类的帕金森病早期诊断预测

张晓博, 杨燕, 李天瑞, 陆凡, 彭莉兰

计算机应用 2020, 40 (10): 3088-3094. DOI: 10.11772/j.issn.1001-9081.2020030359

摘要（503）

PDF （1270KB）（983）

针对多发于老龄人群的帕金森病（PD）的早期智能化诊断的问题，提出基于医疗检测文本信息数据的聚类技术来对PD进行分析预测。首先，对原始数据集进行预处理以获取有效特征信息，并通过主成分分析（PCA）方法将原始特征分别降维到8个不同维度的维度空间；然后，应用5个传统的经典聚类模型和3种不同的聚类集成方法分别对8个维度空间的数据进行聚类；最后，采用4个聚类性能指标来预测数据集中的多巴胺异常PD患者、健康体和无多巴胺缺失（SWEDD） PD患者。仿真结果显示，PCA特征维度值取30时，高斯混合模型（GMM）的聚类准确度达到89.12%；PCA特征维度值取70时，谱聚类（SC）的聚类准确度达到61.41%；PCA特征维度值取80时，元聚类算法（MCLA）的聚类准确度达到59.62%。对比实验结果表明，5种经典聚类方法中，PCA的特征维度值小于40时，高斯混合模型聚类效果最佳；3种聚类集成方法中，对于不同的特征维度，MCLA的聚类性能均表现优异，进而为PD的早期智能化辅助诊断提供了技术和理论支撑。

参考文献 | 相关文章 | 多维度评价

Select

21. 基于值差度量和聚类优化的 K最近邻算法在银行客户行为预测中的应用

李博, 张晓, 颜靖艺, 李可威, 李恒, 凌玉龙, 张勇

计算机应用 2019, 39 (9): 2784-2788. DOI: 10.11772/j.issn.1001-9081.2019030571

摘要（558）

PDF （806KB）（551）

为提升贷款金融客户行为预测的准确性，针对传统的K-最近邻（KNN）算法在数据分析中处理非数值因素的不完备问题，提出了一种采用值差度量（VDM）距离的对聚类结果迭代优化的改进KNN算法。首先对收集到的数据信息进行基于VDM距离的KNN算法的聚类，再对聚类结果进行迭代分析，最后通过联合训练提高了预测精度。基于葡萄牙零售银行2008—2013年收集的客户数据比较可知，改进的KNN算法与传统的KNN算法、基于属性值相关距离的KNN改进（FCD-KNN）算法、高斯贝叶斯算法、Gradient Boosting等现有算法相比具有更好的性能和稳定性，在银行数据预测客户行为中具有很大的应用价值。

参考文献 | 相关文章 | 多维度评价

Select

22. 基于累计工作量的在线大数据分析作业调度算法

李叶飞, 徐超, 许道强, 邹云峰, 张晓达, 钱柱中

计算机应用 2019, 39 (8): 2431-2437. DOI: 10.11772/j.issn.1001-9081.2019010073

摘要（478）

PDF （1056KB）（331）

针对Hadoop和Spark等大数据分析系统中无先验知识任务的高效执行问题，设计了基于累计工作量（CRW）的任务调度器CRWScheduler。该调度器根据CRW将任务在低权重队列与高权重队列间切换；在为作业分配资源时，同时考虑到作业所在的队列和其瞬时占用资源量，无需作业先验知识即显著提升系统性能。基于Apache Hadoop YARN实现了CRWScheduler原型，在28个节点的基准测试集群上的实验表明，与YARN的公平调度机制相比，作业流时间（JFT）平均降低21%，其中95百分位的作业流时间（JFT）最多降低了35%，并且在与任务级调度程序协作时可获得进一步的性能提升。

参考文献 | 相关文章 | 多维度评价

Select

23. 基于深度神经网络的肺炎图像识别模型

何新宇, 张晓龙

计算机应用 2019, 39 (6): 1680-1684. DOI: 10.11772/j.issn.1001-9081.2018102112

摘要（557）

PDF （809KB）（476）

当前的肺炎图像识别算法面临两个问题：一是肺炎特征提取器使用的迁移学习模型在源数据集与肺炎数据集上图像差异较大，所提取的特征不能很好地契合肺炎图像；二是算法使用的softmax分类器对高维特征处理能力不够强，在识别准确率上仍有提升的空间。针对这两个问题，提出了一种基于深度卷积神经网络的肺炎图像识别模型。首先使用ImageNet数据集训练好的GoogLeNet Inception V3网络模型进行特征提取；其次，增加了特征融合层，使用随机森林分类器进行分类预测。实验在Chest X-Ray Images肺炎标准数据集上进行。实验结果表明，该模型的识别准确率、敏感度、特异度的值分别达到96.77%、97.56%、94.26%。在识别准确率以及敏感度指标上，与经典的GoogLeNet Inception V3+Data Augmentation （GIV+DA）算法相比，所提模型分别提高了1.26、1.46个百分点，在特异度指标上已接近GIV+DA算法的最优结果。

参考文献 | 相关文章 | 多维度评价

Select

24. 可扩展及可证安全的射频识别认证协议

史志才, 王益涵, 张晓梅, 陈珊珊, 陈计伟

计算机应用 2019, 39 (3): 774-778. DOI: 10.11772/j.issn.1001-9081.2018081648

摘要（513）

PDF （817KB）（350）

针对目前广泛应用的被动式射频识别（RFID）标签中的计算、存储资源有限，导致RFID认证协议的安全和隐私保护，特别是可扩展性一直没有得到很好解决的问题，提出一种基于哈希函数、可证安全的轻权认证协议。该协议通过哈希运算和随机化等操作确保认证过程中会话信息的保密传输和隐私性；在认证过程中，标签的身份信息通过伪名进行确认，其真实身份没有透漏给阅读器等不信任实体；后端服务器进行身份确认仅需进行一次哈希运算，通过标识符构造哈希表可使身份信息查找时间为常数；每次认证后，标签的秘密信息和伪名等均进行更新，从而确保协议的前向安全性。分析证实，该RFID轻权认证协议具有很好的可扩展性、匿名性和前向安全性，能够抵抗窃听、追踪、重放、去同步化等攻击，而且标签仅需提供哈希运算和伪随机数生成操作，非常适合应用于低成本的RFID系统。

参考文献 | 相关文章 | 多维度评价

Select

25. 分层式三维室内地图分类方法及更新机制

冯光升, 张晓雪, 王慧强, 李冰洋, 袁泉, 陈诗军, 陈大伟

计算机应用 2019, 39 (1): 78-81. DOI: 10.11772/j.issn.1001-9081.2018071657

摘要（451）

PDF （713KB）（313）

针对现有的地图更新方法，在室内地图环境下的效果并不理想的问题，提出了一种分层式的室内地图更新方法。首先以室内物体的活动性为参数，然后进行层次的划分来减少更新数据的数量，最后利用卷积神经网络（CNN）对室内数据进行归属层次的判定。实验结果表明，与版本式更新方法相比，所提算法的更新时间降低了27个百分点；与增量式更新方法相比，其更新时间在更新项大于100后逐渐降低。与增量式更新方法相比更新包大小降低了6.2个百分点，且在数据项小于200之前其更新包一直小于版本式更新方法。所提方法可以显著提高室内地图的更新效率。

参考文献 | 相关文章 | 多维度评价

Select

26. 基于云平台的任务性能采集和分类方法

柳春懿, 张晓, 覃源淞, 芦尚奇

计算机应用 2018, 38 (6): 1665-1669. DOI: 10.11772/j.issn.1001-9081.2017102790

摘要（451）

PDF （797KB）（446）

由于用户在实际使用云平台时，很难确定云平台的云主机类型，所以造成了云平台资源利用率低下的问题。许多典型的解决资源利用率低下的方法，都是从云提供商的角度优化放置算法，而用户选择将限制资源利用率增加；也有一些方法采用云平台下的任务性能短时间采集并预测，但会降低任务分类的准确性。为了达到提高云平台资源利用率、简化用户操作的目的，首先提出一种多属性的任务性能采集工具Lbenchmark，全面采集任务的性能特征，和Ganglia相比负载降低了50%以上。然后，利用该性能数据，提出一种基于权值可配的多 KD树- K最近邻（ KNN）应用性能分类算法，挑选适合参数建立多个基于 KD树的 KNN分类器，通过交叉验证方法调整每个属性在不同分类器的权重，进行选举分类。实验结果表明，所提算法与传统的 KNN相比，计算量明显提高了约10倍以上，而准确性平均提高约10%。该算法可利用数据特征映射将资源建议提供给用户和云提供商，进而提高云平台整体的利用率。

参考文献 | 相关文章 | 多维度评价

Select

27. 基于稀疏编码和岭回归的文本图像复原算法

王之毅, 毕笃彦, 熊磊, 凡遵林, 张晓瑜

计算机应用 2017, 37 (9): 2648-2651. DOI: 10.11772/j.issn.1001-9081.2017.09.2648

摘要（655）

PDF （690KB）（740）

为解决现有稀疏编码方法在文本图像复原中存在的编码码元表述空间有限和计算时间长的问题，提出了一种基于岭回归的稀疏编码文本图像复原方法。首先，该方法在训练阶段使用样本图像块训练出用于稀疏表达的字典，并根据样本图像块和编码码元之间的欧氏距离对样本图像块进行聚类；其次，在局部流形空间构建低质量文本图像块和清晰文本图像块之间的岭回归，实现对编码码元表述空间的局部多线性扩展和快速计算；最后，在测试阶段搜索和低质量文本图像最相近的编码码元，计算出近似的清晰文本图像块，从而避免计算耗时的低质量文本图像块的稀疏编码。实验结果表明，所提算法在恢复的图像质量上相比现有的基于稀疏编码的算法在峰值信噪比上高0.3~1.1 dB，耗时降低了1~2个数量级，为提高文本图像复原质量和提升算法运算速度提供了一种解决方案。

参考文献 | 相关文章 | 多维度评价

Select

28. 私有云平台服务能力检测方法

柳春懿, 张晓, 李阿妮, 陈震

计算机应用 2017, 37 (5): 1236-1240. DOI: 10.11772/j.issn.1001-9081.2017.05.1236

摘要（1068）

PDF （908KB）（946）

针对现阶段使用私有云评测方法缺失所导致搭建私有云供需不匹配的问题，提出了一种自适应、可扩展的私有云系统能力检测方法，可对基础设施即服务（IaaS）云计算系统能力进行评测。首先，通过私有云应用程序接口动态扩展虚拟机数量；然后，通过性能特征模型选取虚拟机所需配置的硬件信息和操作系统类别，并根据用户的需求差异使用不同的负载模型，形成相应的模拟运行环境；最后，使用云计算服务等级协议（SLA）作为测试标准来衡量私有云服务能力。使用所提方法对Openstack开源私有云平台的能力进行了评测，实验结果表明，所提方法可以准确得出私有云服务能力，结果和用户实测一致。该方法负载生成成本更低，测试效率更高。并将该方法与Openstack自带的组件Rally进行对比，拓展性和负载动态模拟有很大的改进。

参考文献 | 相关文章 | 多维度评价

Select

29. 公有云存储系统性能评测方法研究

李阿妮, 张晓, 张伯阳, 柳春懿, 赵晓南

计算机应用 2017, 37 (5): 1229-1235. DOI: 10.11772/j.issn.1001-9081.2017.05.1229

摘要（842）

PDF （1069KB）（759）

随着云存储系统的迅速发展和广泛使用，许多企业开发者和个人用户将其应用从传统存储迁移至公有云存储系统，因此，云存储系统性能成为企业开发者和个人用户关注的焦点。由于传统测试难以模拟足够多的用户同时访问云存储系统；测试环境构建复杂，测试时间长，准备测试环境成本高；受网络因素及外界其他因素影响，评测结果不稳定。针对以上所述云存储系统性能评测的重点和难点，提出一种“云测试云”的公有云存储系统性能评测方法，该方法通过在云计算平台动态申请足够数量的实例，对公有云存储系统性能进行评测。首先，构建通用的性能评测框架，可动态伸缩申请实例，自动化部署评测工具及负载，控制并发访问云存储系统，自动释放实例及收集并反馈评测结果；其次，提出多维度的性能评测指标，涵盖不同典型应用、不同云存储接口；最后，提出一种可扩展通用的性能评测模型，该模型可以评测常见典型应用的性能，分析云存储性能影响因素，可适用于任何的公有云存储平台。为了验证该方法的可行性、合理性、通用性和可扩展性，利用所提方法对Amazon S3云存储系统进行性能评测，并使用s3cmd验证评测结果的准确性。实验结果表明，评测结果可以为企业开发者和个人用户提供参考意见。

参考文献 | 相关文章 | 多维度评价

Select

30. 基于磁盘和固态硬盘的混合存储系统研究综述

陈震, 刘文洁, 张晓, 卜海龙

计算机应用 2017, 37 (5): 1217-1222. DOI: 10.11772/j.issn.1001-9081.2017.05.1217

摘要（870）

PDF （995KB）（1029）

大数据和云计算环境下海量增长的数据对存储系统的超高容量和体系结构带来了极大的挑战。目前存储系统的发展趋向于大容量、低成本和高性能，然而任何单一的存储器件如传统的机械磁盘（HDD）、固态硬盘（SSD）、非易失型性随机存储器等由于其固有的物理特性的限制，并不能满足以上的需求。将不同的存储介质混合组合成高效的存储系统是一个好的解决方法，固态硬盘作为一种高可靠性、低能耗、高性能的存储器被越来越广泛地运用到混合存储系统。通过将固态硬盘与传统磁盘进行组合，利用固态硬盘的高性能和传统磁盘低成本大容量的特点，能够为用户提供大容量的存储空间，保证系统的高性能，同时还能降低成本。通过阐述SSD与HDD混合存储系统的研究现状，对不同的SSD与HDD混合存储系统进行分类总结；然后针对缓存架构和设备同层架构这两种目前最流行的存储架构中涉及到的关键技术和不足进行讨论；最后对基于SSD和HDD的混合存储技术进行概括总结，并对今后该领域的研究重点和方向进行展望。

参考文献 | 相关文章 | 多维度评价