计算机应用 ›› 2014, Vol. 34 ›› Issue (9): 2617-2621.DOI: 10.11772/j.issn.1001-9081.2014.09.2617
陈东辉,曾乐,梁中军,肖卫青
收稿日期:
2014-03-12
修回日期:
2014-04-19
发布日期:
2014-09-30
出版日期:
2014-09-01
通讯作者:
陈东辉
作者简介:
基金资助:
国家气象信息中心青年科技基金资助项目
CHEN Donghui,ZENG Le,LIANG Zhongjun,XIAO Weiqing
Received:
2014-03-12
Revised:
2014-04-19
Online:
2014-09-30
Published:
2014-09-01
Contact:
CHEN Donghui
摘要:
针对气象地面分钟数据要素多样、信息量大、产生频次高等特点,传统的关系型数据库系统在存储和管理数据上出现负载饱满、读写性能不理想等问题。结合对分布式数据库HBase的存储模型的研究,行主键(row key)采用时间加站号的方式设计了气象分钟数据存储结构模型,实现对海量气象数据的分布式存储和元信息管理。对HBase的唯一索引在面对气象业务的复杂查询用例时响应时间过长的问题,使用搜索引擎solr提供的API接口并参考气象业务中的查询用例对相关字段建立辅助索引,来满足业务检索时效。实验结果表明,该系统具有很好的存储能力和检索效率,入库效率最高可达每秒34000条,并且在常规查询用例的结果返回时效达到毫秒级,能够满足大规模气象数据在业务应用中对存储和查询时效的性能要求。
中图分类号:
陈东辉 曾乐 梁中军 肖卫青. 基于HBase的气象地面分钟数据分布式存储系统[J]. 计算机应用, 2014, 34(9): 2617-2621.
CHEN Donghui ZENG Le LIANG Zhongjun XIAO Weiqing. HBase-based distributed storage system for meteorological gound minute data[J]. Journal of Computer Applications, 2014, 34(9): 2617-2621.
[1]SHVACHKO K, KUANG H, RADIA S, et al.The Hadoop distributed file system [C]// Proceedings of the 26th IEEE Transactions on Computing Symposium on Mass Storage Systems and Technologies. Piscataway: IEEE, 2010: 1-10.
[2]GEORGE L. HBase: the definitive guide [M]. Sebastopol: O'Reilly Media, 2011.
[3]STONEBRAKER M. SQL databases v. NoSQL databases [J]. Communications of the ACM, 2010, 53(4): 10-11.
[4]TAN J, MAO X. The structures of Hadoop cloud computing infrastructure and the integrated application of HBase and Hive [J]. Guizhou Science, 2013, 31(5): 32-35. (谭洁清, 毛锡军. Hadoop 云计算基础架构的搭建和HBase和hive的整合应用[J]. 贵州科学, 2013, 31(5): 32-35.)
[5]ZHANG Y, MA Y, MENG X. Efficient processing of spatial keyword queries on HBase [J]. Journal of Chinese Computer Systems, 2012,33(10):2141-2146. (张榆,马友忠,孟小峰.一种基于HBase的高效空间关键字查询策略[J].小型微型计算机系统,2012,33(10):2141-2146.)
[6]CHEN P, AN J. The key as dictionary compression method of inverted index table under the HBase database[J], Journal of Software, 2013, 8(5): 1086-1093.
[7]WANG X. XSemantic: the research of XML keywords retrieval technology based on semantic expansion [D]. Shanghai:Fudan University, 2010. (王先胜.XSemantic:基于语义扩展的XML关键字检索技术研究[D].上海:复旦大学,2010.)
[8]DUTTA H, KAMIL A, POOLERY M, et al.Distributed storage of large-scale multidimensional electroencephalogram data using Hadoop and HBase [M]// Grid and Cloud Database Management. Berlin: Springer, 2011.
[9]ZHAO W, TUO Y, YANG Y, et al.A method of designing a reliable and safe distributed meteorological database system [J]. Journal of Applied Meteorological Science,2006,17(2):250-256. (赵伟,脱宇峰,杨银娟,等.一种安全可靠的分布式气象数据库系统设计.应用气象学报,2006,17(2):250-256.)
[10]〖CM(26*2〗CHEN K, ZHENG W. Cloud computing: system instances and current research [J]. Journal of Software, 2009,20(5):1337-1348. (陈康,郑纬民. 云计算:系统实例与研究现状[J].软件学报,2009,20(5):1337-1348.)
[11]CHEN Y. Design and implementation of communication data distributed query algorithm based on Hadoop [D]. Beijing: Beijing jiaotong University, 2009. (陈勇. 基于Hadoop平台的通信数据分布式查询算法的设计与实现 [D]. 北京: 北京交通大学, 2009.)
[12]ZHU Z. Research and application of massive data processing model based on Hadoop [D]. Beijing: Beijing University of Posts and Telecommunications, 2008. (朱珠. 基于Hadoop的海量数据处理模型研究和应用[D]. 北京: 北京邮电大学, 2008.)
[13]〖CM(26*2〗LIU Y, WANG J, HU S. Performance evaluation and analysis method of cloud-based data processiong system for smart grid [J]. Microelectronics & Computer, 2011,28(8):35-38. (刘越, 王晶华, 虎嵩林. 面向智能电网的云数据处理系统评价方法[J]. 微电子学与计算机, 2011, 28(8): 35-38.)
[14]KHADIKAR V, KANTARCIOGLU M, et al.Jena-HBase: a distributed, scalable and effcient RDF triple store [C] // Proceedings of the 11th International Semantic Web Conference. Berlin: Springer-Verlag, 2012: 1-39. |
[1] | 高威 刘丽华 和斌涛 邓方安. 区块链共识机制与改进算法研究进展[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 翟社平 朱鹏举 杨锐 刘佳一腾. 基于区块链的物联网身份管理系统[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[3] | 蔡锦辉, 尹中旭, 宗国笑, 李俊儒. 面向嵌套分支突破的推断与污点分析融合的方法[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3823-3830. |
[4] | 李博, 黄建强, 黄东强, 王晓英. 基于异构平台的稀疏矩阵向量乘自适应计算优化[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3867-3875. |
[5] | 陈姿芊, 牛科迪, 姚中原, 斯雪明. 适用于物联网的区块链轻量化技术综述[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3688-3698. |
[6] | 高婷婷, 姚中原, 贾淼, 斯雪明. 链上链下一致性保护技术综述[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3658-3668. |
[7] | 贾淼, 姚中原, 祝卫华, 高婷婷, 斯雪明, 邓翔. 零知识证明赋能区块链的进展与展望[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3669-3677. |
[8] | 牛科迪, 李敏, 姚中原, 斯雪明. 面向物联网的区块链共识算法综述[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3678-3687. |
[9] | 杨巍 白璐 宁俊义 董建军 单春海 信俊昌. 异构环境感知的幂律图流划分方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 梁辰 王奕森 魏强 杜江. 基于Transformer-GCN的源代码漏洞检测方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 吴海峰 陶丽青 程玉胜. 集成特征注意力和残差连接的偏标签回归算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 秦学程 刘春颜 李宝 赵蕴龙. 面向工业场景的云边协同数据存储与检索架构[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[13] | 涂进兴, 李志雄, 黄建强. 基于GPU对角稀疏矩阵向量乘法的动态划分算法[J]. 《计算机应用》唯一官方网站, 2024, 44(11): 3521-3529. |
[14] | 曾蠡, 杨婧如, 黄罡, 景翔, 罗超然. 超图应用方法综述:问题、进展与挑战[J]. 《计算机应用》唯一官方网站, 2024, 44(11): 3315-3326. |
[15] | 崔双双 王宏志 朱加昊 吴昊. 面向低能耗高性能的分类器两阶段数据选择方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||