期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于LightGBM算法的能见度预测模型
余东昌, 赵文芳, 聂凯, 张舸
《计算机应用》唯一官方网站    2021, 41 (4): 1035-1041.   DOI: 10.11772/j.issn.1001-9081.2020081589
摘要787)      PDF (1107KB)(810)    收藏
为了提高能见度预报的准确率,尤其是低能见度预报的准确率,提出一种基于集成学习随机森林和LightGBM的能见度预测模型。首先,以数值模式系统的气象预报数据为基础,结合地面气象观测数据、PM 2.5浓度观测数据,利用随机森林算法构建特征向量;其次,针对不同时间跨度的缺失数据,设计了3种缺失值处理方法对缺失值进行替代,生成用于训练和测试的连续性较好的数据样本集;最后,建立基于LightGBM的能见度预测模型,并用网络搜索法对其进行参数优化。把所提模型与支持向量机(SVM)、多元线性回归(MLR)、人工神经网络(ANN)在性能上进行对比。实验结果表明,对于不同的等级的能见度,应用LightGBM的能见度预测模型获得预兆得分(TS)均较高,而对于<2 km的低能见度,该模型对各观测站点的能见度预测值与各观测站点的能见度实况值的平均相关系数为0.75,平均均方误差为6.49。可见基于LightGBM的预测模型能有效提高能见度预测精度。
参考文献 | 相关文章 | 多维度评价
2. 基于粒子群优化和支持向量机的花粉浓度预测模型
赵文芳, 王京丽, 尚敏, 刘亚楠
计算机应用    2019, 39 (1): 98-104.   DOI: 10.11772/j.issn.1001-9081.2018071626
摘要688)      PDF (1158KB)(382)    收藏
为了提高花粉浓度预报的准确率,解决现有花粉浓度预报准确率不高的问题,提出了一种基于粒子群优化(PSO)算法和支持向量机(SVM)的花粉浓度预报模型。首先,综合考虑气温、气温日较差、相对湿度、降水量、风力、日照时数等多种气象要素,选择与花粉浓度相关性较强的气象要素构成特征向量;其次,利用特征向量与花粉浓度数据建立SVM预测模型,并使用PSO算法找出最优参数;然后利用最优参数优化花粉浓度预测模型;最后,使用优化后的模型对花粉未来24 h浓度进行预测,并与未优化的SVM、多元线性回归法(MLR)、反向神经网络(BPNN)作对比。此外使用优化后的模型对某市南郊观象台和密云两个站点进行逐日花粉浓度预测。实验结果表明,相比其他预报方法,所提方法能有效提高花粉浓度未来24 h预测精度,并具有较高的泛化能力。
参考文献 | 相关文章 | 多维度评价
3. Spark Streaming框架下的气象自动站数据实时处理系统
赵文芳, 刘旭林
计算机应用    2018, 38 (1): 38-43.   DOI: 10.11772/j.issn.1001-9081.2017071903
摘要514)      PDF (1144KB)(419)    收藏
针对现有气象自动站业务平台面临处理数据不及时、交互式响应慢、统计时效差等问题,提出了使用Spark Streaming技术和HBase解决该问题的方法,将实时计算框架和分布式数据库系统结合起来实现大规模流式数据处理。使用Flume收集自动站数据,Spark Streaming对数据进行流式处理并存储到HBase数据库中,并设计Spark框架下的自动站数据流式入库处理算法和要素极值的实时统计算法,在Cloudera平台下实现了一个高速可靠的实时采集、处理、统计的应用系统。通过对比分析和性能监测,验证了该系统具有低延迟和高吞吐量的优势,运行状况良好,负载均衡。实验结果表明,Spark Streaming用于气象自动站的实时业务处理,数据并行写入HBase、基于HBase的查询和各类要素统计均能达到毫秒级响应,完全能满足自动站数据的应用需求,有效地支撑天气预报业务。
参考文献 | 相关文章 | 多维度评价
4. DPCS2017+75+Spark Streaming框架下的气象自动站数据实时处理系统
赵文芳 刘旭林
  
录用日期: 2017-08-04