计算机应用 ›› 2014, Vol. 34 ›› Issue (9): 2617-2621.DOI: 10.11772/j.issn.1001-9081.2014.09.2617
收稿日期:
2014-03-12
修回日期:
2014-04-19
出版日期:
2014-09-01
发布日期:
2014-09-30
通讯作者:
陈东辉
作者简介:
基金资助:
国家气象信息中心青年科技基金资助项目
CHEN Donghui,ZENG Le,LIANG Zhongjun,XIAO Weiqing
Received:
2014-03-12
Revised:
2014-04-19
Online:
2014-09-01
Published:
2014-09-30
Contact:
CHEN Donghui
摘要:
针对气象地面分钟数据要素多样、信息量大、产生频次高等特点,传统的关系型数据库系统在存储和管理数据上出现负载饱满、读写性能不理想等问题。结合对分布式数据库HBase的存储模型的研究,行主键(row key)采用时间加站号的方式设计了气象分钟数据存储结构模型,实现对海量气象数据的分布式存储和元信息管理。对HBase的唯一索引在面对气象业务的复杂查询用例时响应时间过长的问题,使用搜索引擎solr提供的API接口并参考气象业务中的查询用例对相关字段建立辅助索引,来满足业务检索时效。实验结果表明,该系统具有很好的存储能力和检索效率,入库效率最高可达每秒34000条,并且在常规查询用例的结果返回时效达到毫秒级,能够满足大规模气象数据在业务应用中对存储和查询时效的性能要求。
中图分类号:
陈东辉 曾乐 梁中军 肖卫青. 基于HBase的气象地面分钟数据分布式存储系统[J]. 计算机应用, 2014, 34(9): 2617-2621.
CHEN Donghui ZENG Le LIANG Zhongjun XIAO Weiqing. HBase-based distributed storage system for meteorological gound minute data[J]. Journal of Computer Applications, 2014, 34(9): 2617-2621.
[1]SHVACHKO K, KUANG H, RADIA S, et al.The Hadoop distributed file system [C]// Proceedings of the 26th IEEE Transactions on Computing Symposium on Mass Storage Systems and Technologies. Piscataway: IEEE, 2010: 1-10.
[2]GEORGE L. HBase: the definitive guide [M]. Sebastopol: O'Reilly Media, 2011.
[3]STONEBRAKER M. SQL databases v. NoSQL databases [J]. Communications of the ACM, 2010, 53(4): 10-11.
[4]TAN J, MAO X. The structures of Hadoop cloud computing infrastructure and the integrated application of HBase and Hive [J]. Guizhou Science, 2013, 31(5): 32-35. (谭洁清, 毛锡军. Hadoop 云计算基础架构的搭建和HBase和hive的整合应用[J]. 贵州科学, 2013, 31(5): 32-35.)
[5]ZHANG Y, MA Y, MENG X. Efficient processing of spatial keyword queries on HBase [J]. Journal of Chinese Computer Systems, 2012,33(10):2141-2146. (张榆,马友忠,孟小峰.一种基于HBase的高效空间关键字查询策略[J].小型微型计算机系统,2012,33(10):2141-2146.)
[6]CHEN P, AN J. The key as dictionary compression method of inverted index table under the HBase database[J], Journal of Software, 2013, 8(5): 1086-1093.
[7]WANG X. XSemantic: the research of XML keywords retrieval technology based on semantic expansion [D]. Shanghai:Fudan University, 2010. (王先胜.XSemantic:基于语义扩展的XML关键字检索技术研究[D].上海:复旦大学,2010.)
[8]DUTTA H, KAMIL A, POOLERY M, et al.Distributed storage of large-scale multidimensional electroencephalogram data using Hadoop and HBase [M]// Grid and Cloud Database Management. Berlin: Springer, 2011.
[9]ZHAO W, TUO Y, YANG Y, et al.A method of designing a reliable and safe distributed meteorological database system [J]. Journal of Applied Meteorological Science,2006,17(2):250-256. (赵伟,脱宇峰,杨银娟,等.一种安全可靠的分布式气象数据库系统设计.应用气象学报,2006,17(2):250-256.)
[10]〖CM(26*2〗CHEN K, ZHENG W. Cloud computing: system instances and current research [J]. Journal of Software, 2009,20(5):1337-1348. (陈康,郑纬民. 云计算:系统实例与研究现状[J].软件学报,2009,20(5):1337-1348.)
[11]CHEN Y. Design and implementation of communication data distributed query algorithm based on Hadoop [D]. Beijing: Beijing jiaotong University, 2009. (陈勇. 基于Hadoop平台的通信数据分布式查询算法的设计与实现 [D]. 北京: 北京交通大学, 2009.)
[12]ZHU Z. Research and application of massive data processing model based on Hadoop [D]. Beijing: Beijing University of Posts and Telecommunications, 2008. (朱珠. 基于Hadoop的海量数据处理模型研究和应用[D]. 北京: 北京邮电大学, 2008.)
[13]〖CM(26*2〗LIU Y, WANG J, HU S. Performance evaluation and analysis method of cloud-based data processiong system for smart grid [J]. Microelectronics & Computer, 2011,28(8):35-38. (刘越, 王晶华, 虎嵩林. 面向智能电网的云数据处理系统评价方法[J]. 微电子学与计算机, 2011, 28(8): 35-38.)
[14]KHADIKAR V, KANTARCIOGLU M, et al.Jena-HBase: a distributed, scalable and effcient RDF triple store [C] // Proceedings of the 11th International Semantic Web Conference. Berlin: Springer-Verlag, 2012: 1-39. |
[1] | 祁祥洲 邢红杰. 基于中心核对齐的多核单类支持向量机[J]. 计算机应用, 0, (): 0-0. |
[2] | 陈浩杰,范江亭,刘勇. 分布式强化学习解决动态旅行商问题[J]. 计算机应用, 0, (): 0-0. |
[3] | 郭一阳 于炯 杜旭升 杨少智 曹铭. 基于自编码器与集成学习的离群点检测算法[J]. 计算机应用, 0, (): 0-0. |
[4] | 王周恺, 张炯, 马维纲, 王怀军. 面向高速列车监测数据的并行解压缩算法[J]. 计算机应用, 2021, 41(9): 2586-2593. |
[5] | 李卓, 宋子晖, 沈鑫, 陈昕. 边缘计算支持下的移动群智感知本地差分隐私保护机制[J]. 计算机应用, 2021, 41(9): 2678-2686. |
[6] | 赵津 宋文爱 邰隽 杨吉江 王青 李晓丹 雷毅 邱悦. 儿童阻塞性睡眠呼吸暂停计算机人脸辅助诊断综述[J]. 计算机应用, 0, (): 0-0. |
[7] | 张妮 韩萌 王乐 李小娟 程浩东. 基于正负效用划分的高效用模式挖掘方法综述[J]. 计算机应用, 0, (): 0-0. |
[8] | 武鹏, 吴尽昭. 基于线性误差断言的推理方法[J]. 计算机应用, 2021, 41(8): 2199-2204. |
[9] | 孙蕊, 韩萌, 张春砚, 申明尧, 杜诗语. 含负项top-k高效用项集挖掘算法[J]. 计算机应用, 2021, 41(8): 2386-2395. |
[10] | 王梓森, 梁英, 刘政君, 谢小杰, 张伟, 史红周. 科研项目同行评议专家学术专长匹配方法[J]. 计算机应用, 2021, 41(8): 2418-2426. |
[11] | 赵全, 汤小春, 朱紫钰, 毛安琪, 李战怀. 大规模短时间任务的低延迟集群调度框架[J]. 计算机应用, 2021, 41(8): 2396-2405. |
[12] | 康军, 黄山, 段宗涛, 李宜修. 时空轨迹序列模式挖掘方法综述[J]. 计算机应用, 2021, 41(8): 2379-2385. |
[13] | 陈静, 毛莺池, 陈豪, 王龙宝, 王子成. 基于改进单点多盒检测器的大坝缺陷目标检测方法[J]. 计算机应用, 2021, 41(8): 2366-2372. |
[14] | 马华, 陈跃鹏, 唐文胜, 娄小平, 黄卓轩. 面向工作者能力评估的众包任务分配方法的研究进展综述[J]. 计算机应用, 2021, 41(8): 2232-2241. |
[15] | 李莉 吴怡 杨祉坤 陈云鹏. 基于分区型区块链医疗电子病历共享方案[J]. , 0, (): 0-0. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||