当前位置:首页 > 报告详情

【01】胡伟华&辛朝晖-超大规模 Flink 调度优化.pdf

上传人: li 编号:29322 2021-02-07 36页 1.76MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大数据处理平台YARN在资源调度、作业启动优化、异常处理和资源隔离等方面的挑战与解决方案。关键数据包括:每天有100+业务触发拉取操作,90%的业务拉取涉及20台以下机器的启动;在作业启动过程中,5%的TasManager能在10秒内启动,而5%超过了10秒,部分甚至超过40秒;使用Session模式可以控制重启作业的耗时在3秒以内;支持设置CPU限制上限和NUMA绑核,提升磁盘IOPS性能2倍。文章提出了包括优化作业启动恢复速度、支持OLAP场景、探索Auto Scaling、丰富的调度策略和调度自动化等未来展望。
如何优化作业启动速度? 如何解决作业重启问题? 如何提升资源隔离效果?
客服
商务合作
小程序
服务号
折叠