当前位置:首页 > 报告详情

5-叶炜晨 - 爱奇艺实时大数据生态体系的演进 - LYS_compressed.pdf

上传人: li 编号:29315 2021-02-07 42页 1.78MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了爱奇艺实时大数据体系的演进,包括以下几个关键点: 1. 发展背景:爱奇艺从2016年开始通过Flume和Kafka进行实时数据采集和清洗,到2018年通过Flink进行实时ETL解析,形成了两级Kafka的生产模式。 2. 实时数仓:爱奇艺从2018年底开始建设实时数仓体系,以解决两级Kafka生产线模式的主要问题,如实时数据重复生产、数据治理水平低下、稳定性差等。 3. 流数据服务:为解决实时数仓体系中的问题,爱奇艺大数据团队于2019年推出了流数据服务,包括流数据服务SDK、数据管理平台和运维管理平台,以提高Kafka服务的高度治理化。 4. 实时数据平台:爱奇艺推出了Talos实时数据生产分发平台,支持业务团队进行实时数仓构建,降低建设实时数仓的开发管理成本。 5. 实时大数据应用:介绍了实时大数据在推荐、广告、运营等场景中的应用,以及实时数据质量监控的重要性。 6. 未来规划:提出了流批一体、湖仓一体、ETL -> ELT、BI + AI等未来发展方向。
实时大数据体系如何演进? 实时数仓与传统数仓有何不同? 实时数据平台如何支持实时数仓构建?
客服
商务合作
小程序
服务号
折叠