当前位置:首页 > 报告详情

孙建强-多源湖仓数据集成在小米的应用与实践.pdf

上传人: Fl****zo 编号:624554 2025-03-31 30页 2.93MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要分享了小米在多源湖仓数据集成方面的应用与实践。小米采用多源湖仓架构,支持17种系统,托管任务数超过5万,日均实时入湖数据量达100亿以上,托管数据源超过5000。通过元数据服务,简化了数据开发和提升了效率。同时,采用分库分表一键同步技术,实现了一键入湖。在数据质量监控方面,小米建立了自动路由机制,增加了巡检和多级监控告警,保证了数据的稳定性。针对数据一致性问题,利用Flink处理在线schema变更,实现了自动同步。未来,小米计划结合AI大模型优化异常诊断,建设更高可用的CDC实时采集,构建更集成化的应用产品,并调研对比SeaTunnel引擎,提供更丰富的数据同步能力。
"小米如何实践多源湖仓数据集成?" "小米的数据集成服务应用规模如何?" "小米未来在数据集成方面有哪些计划?"
客服
商务合作
小程序
服务号
折叠