当前位置:首页 > 报告详情

3741 - 利用 Apache Gluten 提升 Pinterest 的数据查询性能.pdf

上传人: 竿*** 编号:982858 2025-11-29 20页 241.43KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《Enhancing Pinterest’s Data Platform》报告,以下是全文关键点: 1. Pinterest从Hive迁移至Spark 2.4,随后升级至Spark 3.2,但面临性能和成本挑战。 2. 引入Apache Gluten和Velox以优化性能,实现至少10%的速度提升。 3. Gluten配置管理集成到自定义Spark,支持多种工具和集成。 4. 性能测试显示,平均查询速度提升70%,内存使用减少2倍。 5. 成本节约显著,单个作业年节省超过15万美元。 6. 面临兼容性、内存管理和配置挑战。 7. 未来计划包括提高查询兼容性、迁移数据集、加速作业自动上线等。
"Spark性能提升秘诀" "Apache Gluten如何优化查询" "Pinterest大数据平台革新"
客服
商务合作
小程序
服务号
折叠