摘要: 随着科技的发展,SaaS模式平台大数据应用复杂多样,可能同时包含不同特征的数据和计算,这种情况下单一的计算模式难以满足多个应用的需求,而多种计算模式的混搭必将伴随着数据转储和使用维护难度大等问题。Spark提供的内存计算引擎包含了多种经典计算模式包括流计算、批处理计算、图计算等,故而越来越多的企业采用Spark作为混合大数据计算平台。而当Spark Streaming在流处理中应用深入,往往面临着数据流实时性、动态变化和海量性等特征以及多用户多应用下任务处理的延时要求不同带来的挑战,而现有两种动态资源分配策略不能很好满足这种数据流处理挑战。针对这一问题,提出了一种多应用下的动态资源分配模型,该方法基于历史数据反馈,动态调整计算资源,以应对数据流变化和多用户不同需求,实验测试结果表明,该方法能够有效调整资源配额,减低处理延时
中图分类号: