当前位置:首页 > 报告详情

陈韦廷-Apache Gluten的现在与未来.pdf

上传人: Fl****zo 编号:624559 2025-03-31 36页 2.11MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Apache Gluten框架,它是一个由Intel和Kyligence共同发起的,用于将Spark的SQL执行加速到原生引擎的中间层。Gluten可以将Spark的整个阶段物理计划转换为Substrait计划,并发送到原生执行。它支持将性能关键的数据处理卸载到原生库,定义了清晰的JNI接口,可以轻松切换原生后端,并支持与Spark的分布式控制流一起使用。 Gluten已经实现了对37个最常见Spark操作符中的84%的支持,对289个常见Spark函数中的92%进行了支持。在TPC-H和TPC-DS基准测试中,Gluten分别实现了3.3倍和2.7倍的性能提升。此外,Gluten还支持包括Intel QAT在内的多种Intel加速器,并已在包括Alibaba、Baidu、ByteDance、Tencent、Meituan等18家客户的生产环境中得到应用。 Gluten目前是一个Apache孵化项目,已经吸引了超过163名贡献者,并获得了超过1300个星标。它的性能在Intel Xeon 6960P上达到了3.3倍的提升,在Intel Xeon 6780E上达到了2.74倍的性能功耗比提升。
Gluten如何加速Spark SQL查询? Gluten有哪些客户成功案例? Gluten未来有哪些发展计划?
客服
商务合作
小程序
服务号
折叠