当前位置:首页 > 报告详情

Talkingdata:Flink在数据分析中的应用(24页).pdf

上传人: 科*** 编号:15223 2020-08-01 24页 3.79MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Flink在TalkingData数据分析中的应用及实践经验。TalkingData在2014年前后面临流处理背景与痛点,如性能问题、容错机制不足等。在对比了Flink和Storm后,TalkingData选择Flink作为流处理工具,并逐步将业务迁移至Flink。实践表明,Flink在处理大规模数据方面表现稳定,能有效减少GC,提高吞吐量。同时,文章也提到了Flink在资源分配、网络栈优化、序列化反序列化等方面的实践经验,如尽可能将operator chain在一起,避免网络传输和序列化反序列化的开销,使用Flink 1.5之后的版本等。目前,Flink已经支持TalkingData分析线日均63亿package,峰值达到9.5w package/s 80w events/s的体量。未来,TalkingData计划将更复杂的业务迁移到Flink上,甚至Batch Job。
"Flink在TalkingData中的实战应用有哪些?" "如何解决Flink在数据分析中的网络栈阻塞问题?" "如何优化Flink在TalkingData SaaS分析中的资源分配?"
客服
商务合作
小程序
服务号
折叠