检索结果

Select

1. 面向测试用例生成的大模型高效微调方法

曹鹏, 温广琪, 杨金柱, 陈刚, 刘歆一, 季学纯

《计算机应用》唯一官方网站 2025, 45 (3): 725-731. DOI: 10.11772/j.issn.1001-9081.2024111598

摘要（70）

HTML （7）

PDF （1215KB）（28）

基于数据驱动的单元测试代码自动化生成技术存在覆盖率低和可读性差的问题，难以应对日益增长的测试需求。大语言模型（LLM）在代码生成任务中显示了极大的潜力，然而由于代码数据的功能风格和编码风格的差异，LLM面临灾难性遗忘和资源受限这2个挑战。为了解决这些问题，提出将编码风格和功能风格同步迁移微调的思想，并开发一种高效的LLM微调训练方法用于单元测试用例生成。首先，利用广泛使用的指令数据集对LLM进行指令对齐，并按任务类型对指令集分类；同时，提取并存储具有任务特征的权重增量；其次，设计一个自适应风格提取模块，该模块包含抗噪声干扰学习和编码风格回溯学习，以应对不同的代码编写风格；最后，在目标域分别对功能风格增量和编码风格增量进行联合训练，以实现在目标域低资源情况下的高效适配和微调。在SF110 Corpus of Classes数据集上的测试用例生成实验结果表明，所提方法的结果均优于对比方法，与主流代码生成LLM Codex、Code Llama和DeepSeek-Coder相比，所提方法的编译率分别提高0.8%、43.5%和33.8%、分支覆盖率分别提高3.1%、1.0%和17.2%；行覆盖率分别提高4.1%、6.5%和15.5%，验证了所提方法在代码生成任务上的优越性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于多特征融合的多尺度生成对抗网络图像修复算法

陈刚, 廖永为, 杨振国, 刘文印

《计算机应用》唯一官方网站 2023, 43 (2): 536-544. DOI: 10.11772/j.issn.1001-9081.2022010015

摘要（514）

HTML （21）

PDF （4735KB）（190）

针对多尺度生成式对抗网络图像修复算法（MGANII）在修复图像过程中训练不稳定、修复图像的结构一致性差以及细节和纹理不足等问题，提出了一种基于多特征融合的多尺度生成对抗网络的图像修复算法。首先，针对结构一致性差以及细节和纹理不足的问题，在传统的生成器中引入多特征融合模块（MFFM），并且引入了一个基于感知的特征重构损失函数来提高扩张卷积网络的特征提取能力，从而改善修复图像的细节性和纹理特征；然后，在局部判别器中引入了一个基于感知的特征匹配损失函数来提升判别器的鉴别能力，从而增强了修复图像的结构一致性；最后，在对抗损失函数中引入风险惩罚项来满足利普希茨连续条件，使得网络在训练过程中能快速稳定地收敛。在CelebA数据集上，所提的多特征融合的图像修复算法与MANGII相比能快速收敛，同时所提算法所修复图像的峰值信噪比（PSNR）、结构相似性（SSIM）比基线算法所修复图像分别提高了0.45%~8.67%和0.88%~8.06%，而Frechet Inception距离得分（FID）比基线算法所修复图像降低了36.01%~46.97%。实验结果表明，所提算法的修复性能优于基线算法。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 面向工业生产的中文Text-to-SQL模型

吕剑清, 王先兵, 陈刚, 张华, 王明刚

《计算机应用》唯一官方网站 2022, 42 (10): 2996-3002. DOI: 10.11772/j.issn.1001-9081.2021081525

摘要（671）

HTML （43）

PDF （1886KB）（266）

英文自然语言查询转SQL语句（Text-to-SQL）任务的模型迁移到中文工业Text-to-SQL任务时，由于工业数据集的可解释差且比较分散，会出现数据库的表名列名等信息与问句中关键信息的表示形式不一致以及问句中的列名隐含在语义中等问题导致模型精确匹配率变低。针对迁移过程中出现的问题，提出了对应的解决方法并构建修改后的模型。首先，在数据使用过程中融入工厂元数据信息以解决表示形式不一致以及列名隐含在语义中的问题；然后，根据中文语言表达方式的特性，使用基于相对位置的自注意力模型直接通过问句以及数据库模式信息识别出where子句的value值；最后，根据工业问句查询内容的特性，使用微调后的基于变换器的双向编码器表示技术（BERT）对问句进行分类以提高模型对SQL语句结构预测的准确率。构建了一个基于铝冶炼行业的工业数据集，并在该数据集上进行实验验证。结果表明所提模型在工业测试集上的精确匹配率为74.2%，对比英文数据集Spider上各阶段主流模型的效果后可以看出，所提模型能有效处理中文工业Text-to-SQL任务。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 关系数据库中聚合代数约束的高效发现算法——AAC-Hunter

张效伟, 江大伟, 陈珂, 陈刚

计算机应用 2021, 41 (3): 636-642. DOI: 10.11772/j.issn.1001-9081.2020091473

摘要（407）

PDF （1077KB）（708）

针对如何更好地维护关系数据库的数据完整性以及帮助审计员找出违规的报销记录的问题，提出了自动发现聚合代数约束（AAC）的算法AAC-Hunter。AAC是一种定义在数据库中两列的聚合结果之间的模糊约束，作用于大多数而非全部记录上。AAC-Hunter首先枚举连接、分组和代数表达式来产生候选AAC，然后分别计算这些候选AAC的值域集合，最后输出AAC结果。但该方法无法应对海量数据带来的性能挑战，因此AAC-Hunter提出了一套启发式规则减小候选约束空间规模以及基于中间结果复用和消除平凡候选AAC的两个优化策略来加速候选AAC的值域集合计算。实验结果表明了对比不使用启发式规则和优化策略的基线算法，AAC-Hunter在TPC-H和European Soccer数据集上分别减小了95.68%和99.94%的约束发现空间，分别缩短了96.58%和92.51%的运行时间。可见AAC-Hunter具备有效性，能够提升审计应用的效率和能力。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于数据降维与精确欧氏局部敏感哈希的 k近邻推荐方法

郭喻栋, 郭志刚, 陈刚, 魏晗

计算机应用 2017, 37 (9): 2665-2670. DOI: 10.11772/j.issn.1001-9081.2017.09.2665

摘要（572）

PDF （1114KB）（534）

针对基于 k近邻的协同过滤推荐算法中存在的评分特征数据维度过高、 k近邻查找速度慢，以及评分冷启动等问题，提出基于数据降维与精确欧氏局部敏感哈希（E ²LSH）的 k近邻协同过滤推荐算法。首先，融合评分数据、用户属性数据以及项目类别数据，将融合后的数据作为输入对堆叠降噪自编码（SDA）神经网络进行训练，取神经网络编码部分最后一个隐层的值作为输入数据的特征编码，完成非线性降维。然后，利用精确欧氏局部敏感哈希算法对降维后的数据建立索引，通过检索得到目标用户或目标项目的相似近邻。最后，计算目标与近邻之间的相似度，利用相似度对近邻的评分记录加权得到目标用户对目标项目的预测评分。在标准数据集上的实验结果表明，在冷启动场景下，均方根误差比基于局部敏感哈希的推荐算法（LSH-ICF）平均降低了约7.2%，平均运行时间和LSH-ICF相当。表明该方法在保证推荐效率的前提下，缓解了评分冷启动问题。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于Linux名字空间的Web服务器动态防御方法

陈刚, 郭玉东, 魏小锋

计算机应用 2017, 37 (12): 3442-3446. DOI: 10.11772/j.issn.1001-9081.2017.12.3442

摘要（552）

PDF （811KB）（740）

Web服务器广泛部署在以Docker容器为代表的云计算平台上，面临着严峻的安全挑战。为了提高此类Web服务器的安全防御能力，提出一种基于Linux名字空间的Web服务器动态防御方法。该方法能够保证在Web服务正常工作的前提下，首先使用名字空间构建Web服务器运行环境；其次，通过多环境的交替运行来实现Web服务器的动态变换以迷惑入侵者，增加入侵者对Web服务器的攻击难度；最后，通过定期主动清除并重建Web服务器的运行环境来消除入侵行为对Web服务器的影响，最终实现有效提高Web服务器的动态防御能力。实验结果表明，所提方法能够有效增强Web服务器的安全性，同时对系统性能影响很小，请求响应100 KB数据的时间损耗为0.02~0.07 ms。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于随机一致性采样估计的目标跟踪算法

勾承甫, 陈斌, 赵雪专, 陈刚

计算机应用 2016, 36 (9): 2566-2569. DOI: 10.11772/j.issn.1001-9081.2016.09.2566

摘要（407）

PDF （791KB）（318）

为了解决在实际监控中因为目标遮挡、外观变化和时间过长导致跟踪丢失的问题，提出一种基于随机一致性采样（RANSAC）估计的目标跟踪算法。算法首先在搜索区域提取局部不变特征集，然后利用特征匹配传递性和非参数学习算法从特征集中分离出目标特征，最后对目标特征进行RANSAC估计跟踪目标位置。将算法在不同场景的视频数据集上进行测试，分别从准确率、召回率和综合评价指标F1-Measure三个指标分析算法性能，实验结果表明所提出的算法提高了目标跟踪的准确性，克服了长时间目标跟踪产生的跟踪漂移。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于精确欧氏局部敏感哈希的协同过滤推荐算法

李红梅郝文宁陈刚

计算机应用 2014, 34 (12): 3481-3486.

摘要（251）

PDF （937KB）（777）

针对推荐系统中用户评分数据的海量高维与稀疏性,以及直接利用传统相似性度量方法来获取近邻的计算量大、结果不准等对推荐质量的影响,提出基于精确欧氏局部敏感哈希(E2LSH)的协同过滤推荐算法。首先利用精确欧氏局部敏感哈希算法对用户评分数据进行降维处理并构建索引,以快速获取目标用户的近邻用户；然后利用加权策略来预测用户评分,进而完成协同过滤推荐。实验结果表明,该算法能有效解决用户数据的海量高维与稀疏性问题,且运行效率高,具有较好的推荐质量。

参考文献 | 相关文章 | 多维度评价

Select

9. 求三支决策最优阈值的新算法

陈刚刘秉权吴岩

计算机应用 2012, 32 (08): 2212-2215. DOI: 10.3724/SP.J.1087.2012.02212

摘要（964）

PDF （625KB）（530）

传统的三支决策模型是依靠专家经验来设置阈值的，从而阻碍了三支决策模型在许多领域的广泛应用。针对此不足，提出不需要依赖于专家经验的基于网格搜索的最优阈值生成算法，即以三支决策风险损失函数为模型，以决策风险最小为目标，以网格搜索为手段，以样本的条件概率为搜索空间，找出能使风险损失最小的参数组合——最优阈值。最后将以该算法得到的阈值构建的三支分类器与贝叶斯分类器分别应用于UCI部分数据集，结果显示三支分类器分类性能更优，从而说明该算法有效。

参考文献 | 相关文章 | 多维度评价

Select

10. 改进的基于二阶互信息的配准技术

陈北京李均利陈刚

计算机应用

摘要（1501）

PDF （846KB）（891）

着重分析讨论了灰度级别、邻域信息对基于二阶互信息的配准技术的影响,通过实验分析得到在PV插值基础上最佳的灰度级别、邻域信息,从而改进了基于二阶互信息的配准技术,并借助分析噪声对配准的影响来解释相关结论。