当前位置:首页 > 报告详情

3、网易游戏基于 Flink 的流式 ETL 建设-zx.pdf

上传人: li 编号:29302 2021-02-07 29页 9.16MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了网易易游戏基于Flink的流式ETL建设。易游戏ETL服务支持MongoDB等schema-free数据库,采用反范式设计,数据异构以复杂内嵌字段避免大部分Join需求。ETL服务涵盖运营日志、业务事件日志和程序运行日志,具有实时离线统一Schema的特点。 易游戏ETL发展经历了基于Hadoop Streaming、Spark Streaming到Flink DataStream的演变。Flink DataStream支持实时数据仓库集成,提供实时数仓元数据持久化方案。 调优实践方面,文章提到了HDFS写入调优和小文件问题,以及基于OperatorState的SLA统计。数据容错和恢复通过SideOutput收集异常消息,并输出到Hive或Kafka。 未来规划方面,易游戏ETL将支持数据湖,满足有UPDATE、DELETE需求的业务,提供更丰富的附加功能,如实时数据去重、自动小文件合并,并支持PyFlink,满足数据集成以外的Python需求。
"网易易游戏如何利用Flink进行流式ETL?" "网易易游戏ETL服务中,日志明细有哪些用途?" "网易易游戏未来在实时数据处理方面有哪些规划?"
客服
商务合作
小程序
服务号
折叠