当前位置:首页 > 报告详情

李振炜-基于Doris湖仓一体分析系统在快手的实践.pdf

上传人: 张** 编号:168982 2024-07-06 35页 2.07MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了快手公司基于Doris湖仓一体分析系统的实践。面临数据入仓代价大、加工链路复杂、数据治理成本大等问题,快手重构了分析系统,实现了湖仓一体分析系统,提高了数据交付能力和治理能力。关键点包括:1) 数仓执行引擎选型,结合业界趋势和公司实践,选择了Doris;2) Doris的功能调整,包括元数据缓存、数据缓存、外表统计信息、排序主键索引、预处理bucket表等;3) 自动物化功能引入,由消费驱动生产,降低数据工程师工作量,提高查询效率;4) 缓存系统设计,包括表信息缓存、分区信息缓存等;5) 自动物化系统实现,包括物化发现、管理和生产在外部系统实现,复用Doris物化改写能力,支持数据量较大的表进行物化。
"Doris如何实现湖仓一体分析系统?" "自动物化功能如何优化Doris的查询性能?" "湖仓一体分析系统面临哪些挑战和解决方案?"
客服
商务合作
小程序
服务号
折叠