%0 Journal Article %A 简艺恒 %A 余啸 %T 基于数据过采样和集成学习的软件缺陷数目预测方法 %D 2018 %R 10.11772/j.issn.1001-9081.2018020507 %J 计算机应用 %P 2637-2643 %V 38 %N 9 %X 预测软件缺陷的数目有助于软件测试人员更多地关注缺陷数量多的模块,从而合理地分配有限的测试资源。针对软件缺陷数据集不平衡的问题,提出了一种基于数据过采样和集成学习的软件缺陷数目预测方法——SMOTENDEL。首先,对原始软件缺陷数据集进行n次过采样,得到n个平衡的数据集;然后基于这n个平衡的数据集利用回归算法训练出n个个体软件缺陷数目预测模型;最后对这n个个体模型进行结合得到一个组合软件缺陷数目预测模型,利用该组合预测模型对新的软件模块的缺陷数目进行预测。实验结果表明SMOTENDEL相比原始的预测方法在性能上有较大提升,当分别利用决策树回归(DTR)、贝叶斯岭回归(BRR)和线性回归(LR)作为个体预测模型时,提升率分别为7.68%、3.31%和3.38%。 %U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2018020507