当前位置:首页 > 报告详情

【15-B01】苏舒-腾讯基于Flink+ Iceberg 全场景实时数仓的建设实践.pdf

上传人: li 编号:29332 2021-02-07 32页 2.51MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯数据平台部高级工程师苏舒在构建基于Flink和Iceberg的实时数仓实践中的最佳经验和未来规划。 关键点如下: 1. 背景和痛点:苏舒指出,传统的Lambda架构在处理大规模数据时存在痛点,如实时小文件问题等。 2. 数据湖技术Apache Iceberg:苏舒详细介绍了Apache Iceberg的开源表格式,用于处理大规模分析数据,并分享了其在腾讯的应用实践。 3. 实时数仓建设的需求:苏舒提出了构建实时数仓的需求,并强调了秒级分析在数据湖加速中的重要性。 4. 近实时数据接入:苏舒讨论了如何实现近实时数据接入,以及如何通过构建统一的数据加速层来提高数据搜索效率。 5. 未来规划:苏舒展望了未来的规划,包括构建统一的数据加速层,实现行级删除功能,以及完善SQL扩展能力等。 通过这些实践和规划,苏舒旨在提高数据平台的性能和效率,以满足腾讯内部各种业务需求。
"实时数仓如何构建?" "Apache Iceberg是什么?" "如何解决实时小文件问题?"
客服
商务合作
小程序
服务号
折叠