计算机应用 ›› 2013, Vol. 33 ›› Issue (09): 2490-2492.DOI: 10.11772/j.issn.1001-9081.2013.09.2490
覃远翔1,段亮1,岳昆1,2
QIN Yuanxing1,DUAN Liang1,YUE Kun1,2
摘要: 针对不确定性数据中往往包含一些异常数据而导致相应的查询结果出现错误的问题,提出了一种基于信息熵的不确定性数据清理方法以减少异常数据并提高不确定性数据的质量。首先使用信息熵来度量数据的不确定度,然后结合统计学方法计算出不确定性数据的可信区间,最后去除那些不在可信区间内的数据。实验结果验证了该方法的高效性和有效性。
中图分类号: