当前位置:首页 > 报告详情

6-4 字节跳动流式数仓和实时服务分析的思考和实践.pdf

上传人: 云闲 编号:101929 2021-01-01 16页 1.37MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了字节跳动在流式数仓和实时分析服务的实践与思考。面对 EB 级别的存储空间和每天平均 70PB 数据的增量,字节跳动遇到了数据和系统冗余、数据一致性和正确性、Serving 性能等问题。为解决这些问题,字节跳动提出了基于 Flink 的流批一体解决方案,使用 Flink 动态表解决了数据和系统冗余问题,并通过 HSAP 服务型引擎优化解决了服务性能问题。Flink 动态表支持任意 DDL 和 SQL 定义,存储结构为列存 Merge Tree,支持流批一体的高效分析。此外,字节跳动还研发了云原生实时服务分析系统 HSAP,满足用户高 QPS、低 Latency 的在线 Serving 需求和海量数据的实时复杂分析需求。火山引擎云原生计算提供了一站式大数据管理平台,支持实时和离线计算,便捷的运维开发,并基于云原生技术部署,提升了资源利用率。
"字节跳动如何处理海量数据?" "火山引擎如何实现实时数据仓库技术?" "HSAP如何满足大数据场景的实时服务需求?"
客服
商务合作
小程序
服务号
折叠