当前位置:首页 > 报告详情

袁尤军-SmartNews基于Flink的实时数仓建设.pdf

上传人: 云闲 编号:101893 2021-01-01 24页 57.65MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了SmartNews公司基于Flink的实时数仓建设情况。自2020Q2立项以来,Flink已成为SmartNews实时数据处理的最佳选择。目前,SmartNews已通过Flink实现了多租户、多版本的易用性,并在2021Q4将Flink部署到K8S,实现了资源的高效管理。实时数仓的发展背景和策略方面,SmartNews采取了由粗及细的策略,从日表到小时表再到分钟级表,实现了数据处理速度的显著降低。在具体的例子中,文章以fluentdagent的数据处理为例,说明了SmartNews如何通过Flink实现实时数据处理,并解决了数据倾斜和文件大小等问题。未来规划和挑战方面,SmartNews计划实现小时级和分钟级的数据处理,并将面临千亿级别表的近实时join等挑战。同时,离线在线数据的互通、历史数据的删除以及计算和存储效率的提升也是SmartNews需要解决的问题。
"Flink在SmartNews中的实战应用如何?" "实时数仓建设中的挑战与解决方案是什么?" "未来实时数仓技术发展将面临哪些机遇与挑战?"
客服
商务合作
小程序
服务号
折叠