当前位置:首页 > 报告详情

幸福里基于 Flink&Paimon 的流式数仓实践.pdf

上传人: 张** 编号:155309 2024-02-15 26页 2.33MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了字节跳动基础架构工程师李国君在流式数仓实践方面的经验。主要内容包括:1. 业务背景:以工单系统为例,介绍实时数仓建模特点和业务实时数仓Pipeline;2. 痛点分析:开发复杂度高、运维成本高、状态量大、数据新鲜度差和小文件问题;3. 选择Paimon的原因:流批一体存储、不需要去重、血缘管理及数据一致性管理;4. 流式数仓实践:架构设计、调优及收益;5. 调优方法:数据可见性与Checkpoint解绑、建立监控体系。总体来看,流式数仓实践能够节省约30%的状态量、缩短约50%的开发周期,实现1-2min的端到端延迟。
"流式数仓如何提高数据准确性?" "如何解决流式数仓的运维成本高问题?" "流式数仓在未来有哪些规划和发展方向?"
客服
商务合作
小程序
服务号
折叠