当前位置:首页 > 报告详情

Apache Celeborn|让 Spark 和 Flink 更快更稳更弹性.pdf

上传人: 张** 编号:155417 2024-02-15 29页 5.60MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了阿里云数据湖Spark引擎负责人周克勇在Streaming lakehouse meetup上分享的关于Spark/Flink与Celeborn结合的使用体验。Celeborn是一个统一的中间数据服务,旨在解决传统Shuffle在资源消耗、稳定性、弹性等方面的问题。其核心设计包括列式Shuffle、向量化引擎、多层存储和异步操作,能有效减少Shuffle数据大小,优化存储和网络性能。Celeborn在稳定性、滚动重启性能和弹性方面表现出色,能够支持大规模作业的快速滚动升级和重启,实现存算分离,提升作业性能。目前,Celeborn已在社区取得积极反馈,与Gluten等向量化引擎实现对接。感兴趣的读者可以通过GitHub、钉钉群和微信公众号了解更多信息并加入社区。
"Celeborn如何提升Spark/Flink性能?" "如何实现Spark/Celeborn在K8s上的弹性部署?" "Celeborn如何确保大数据作业的稳定性和可靠性?"
客服
商务合作
小程序
服务号
折叠