当前位置:首页 > 报告详情

(线上)郑志升-Apache Flink在bilibili的多元化探索与实践-美化TY已定稿 .pdf

上传人: li 编号:29298 2021-02-07 44页 24.82MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了B站基于Flink的实时数据处理和AI实践。B站面临数据处理时效性差、资源编排压力大、离线和实时计算gap难以满足等问题,通过基于Flink的生态化实践,实现了实时数仓、实时机器学习等应用。Flink在B站的实践包括:数据质量、数据时效、ETL联动、稳定性、分区容错等方面的问题优化,实现了万亿级增量管道的稳定运行。AI实时工程复杂,B站采用BSQL编程、特征工程等方法,提高实验迭代效率,降低算法人员的工程门槛。同时,B站还构建了端到端的实时AI协作平台,实现了从离线到实时、从数据处理到模型训练、从模型训练到实验效果的全链路打通。未来,B站将继续探索实时AI平台的发展,结合数据湖、实时AI平台等技术,进一步提高实时数据处理和AI实践的效率。
"Flink在B站的实时实践如何提升数据处理效率?" "B站如何通过Flink实现实时特征工程与离线特征的融合?" "实时AI工程中,B站面临哪些挑战与痛点?如何解决?"
客服
商务合作
小程序
服务号
折叠