当前位置:首页 > 报告详情

杨涵冰-Flink 在实时标签系统中的实践-已美化TY-y已定稿_compressed.pdf

上传人: li 编号:29312 2021-02-07 16页 620.57KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Flink在实时标签系统中的实践,包括架构简介、四大标签类型的同步和实时计算,以及风控类的复杂逻辑和实践案例。 架构简介部分,提到了RDS、Flink、HBase、EMR、Hive、API、DTSSqoop等技术的应用,实现了线上数据的实时写入和离线修正。 四大标签类型包括原生标签、同步线上数据、离线差值修正和即时计算标签。原生标签通过配置,可以简单地将各业务系统的用户信息同步到标签系统中。即时计算标签则用于实现复杂逻辑的实时计算。 风控类的实践案例中,提到了根据不同业务需求,采用不同的排重统计方法和图关系计算。如单维度数据量较少时,可以直接存储在HBase中进行统计;数据量较多时,则需要进行差值统计或有损统计。同时,还提到了标签更新时间和整体更新时间的概念,以解决标签时效性的问题。 总的来说,本文通过Flink和一系列大数据技术的应用,实现了实时标签系统的构建,满足了不同业务场景下的数据处理和风控需求。
"Flink在实时标签系统中的应用如何实现?" "如何利用Flink和HBase实现实时数据同步与差值修正?" "在实时标签系统中,如何解决时效性波动的问题?"
客服
商务合作
小程序
服务号
折叠