当前位置:首页 > 报告详情

5-马国维(黎钢)、高谟(云骞)-基于Flink DataStream API的流批一体处理-ZH.pdf

上传人: li 编号:29339 2021-02-07 40页 140.31MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Flink DataStream API的流批一体处理,以及Flink在实时数据处理和历史数据处理逻辑复用方面的优势。文章指出,Flink API Stack已支持两种类型的作业:有界作业和无界作业。然而,DataStream API在处理一些复杂语义时对有界作业意义不大。因此,文章提出了流批统一的DataStream接口的目标,包括提供基于DataStream API的批执行模式、废弃DataSet API、修改默认时间类型为Event Time等。 目前,Flink 1.12版本初步实现了流批一体的DataStream API,并增强了Runtime对流批一体的支持。此外,Flink 1.12还引入了插件化的Shuffle Service和针对Blocking边的Sort-Merge Shuffle,提高了Shuffle的性能。在统一Connector方面,Flink实现了Source和Sink的统一Connector,并可以通过参数或代码设置运行时模式。 未来,Flink需要进一步支持批特有的操作,如迭代和流批混合作业,并优化对更多应用场景的支持。总之,Flink DataStream API的流批一体处理为实时数据处理和历史数据处理提供了更多可能性,并有望在更多应用场景中发挥重要作用。
"Flink如何实现流批一体处理?" "流批一体的Flink DataStream API有哪些优势?" "Flink在支持流批一体处理上还有哪些未来工作?"
客服
商务合作
小程序
服务号
折叠