当前位置:首页 > 报告详情

3-王磊-Blaze:SparkSQL Native算子优化在快手的深度优化及大规模实践.pdf

上传人: 张** 编号:169016 2024-07-06 27页 5.29MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了快手自研的基于Rust和DataFusion/Arrow开发的Spark向量化执行引擎Blaze,以及其在快手的深度优化和大规模实践。Blaze通过向量化计算,提高了计算效率,减少了读写过程的行列互转开销。文章详细介绍了Blaze的原理、架构设计、面向生产的深度优化、当前进展及未来规划。在生产环境上线后,Blaze在TPC-H和TPC-DS测试中表现优异,平均性能提升2.8倍和3倍。目前,Blaze已在Adhoc场景全量上线,算力平均提升30%+,ETL场景覆盖40%任务,累计年化收益数千万。未来,Blaze将持续迭代优化,推动线上应用全面上线,支持更多引擎,并建设开源社区。
如何持续提升计算引擎执行效率? 向量化计算在现代数据处理中的优势有哪些? Blaze在生产环境中上线后的实际效果如何?
客服
商务合作
小程序
服务号
折叠