《极速入湖即刻分析:Apache Doris 实时数据湖架构的现代化演进.pdf》由会员分享,可在线阅读,更多相关《极速入湖即刻分析:Apache Doris 实时数据湖架构的现代化演进.pdf(25页珍藏版)》请在三个皮匠报告上搜索。
1、极极速速入入湖湖|即即刻刻分分析析陈明雨Apache Doris PMC Chair飞轮科技技术副总裁Apache Doris实时数据湖架构的现代化演进D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u
2、m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用Apache Doris PMC Chair飞轮科技技术副总裁拥有 10 年分布式系统领域经验,专注于分布式可扩展分析型数据库。目前主要负责数据湖仓(Lakehouse)相关研发工作。陈陈明明雨雨S Sp pe ea ak ke er rD o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m
3、 m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用从从数数据据湖湖到到查查询询分分析析WWh hy y T Th hi is s MMa at tt te er rs sD o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m
4、 m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用为为什什么么我我们们需需要要 L La ak ke eh ho ou us se e现代数据基础设施面临一个根本性挑战:在经经济济高高效效的的存存储储与高高性性能能分分析析之间实现平衡。企业组织越来越需要在统一架构中同时具备这两种能力。Data Lakes:为海量原始数
5、据提供卓越的灵活性与成本效益,支持以原生格式直接存储。Databases:依托结构化数据模型,提供高性能查询能力与实时分析能力。痛点:企业需要对存储在数据湖中的海量数据集进行实时分析,同时不不牺牺牲牲性性能能、不不降降低低数数据据新新鲜鲜度度、不不超超出出预预算算。D Da at ta a L La ak ke es s 低存储成本 灵活的 Schema 保留原始数据语义D Da at ta ab ba as se es s 高性能查询 实时数据处理 ACID 保证L La ak ke eh ho ou us se e A Ar rc ch hi it te ec ct tu ur re e融
6、合两者优势,兼具双重特性D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用D o r i s S u m m i t 公开资料严禁商用数数据据库库和和数数据据湖湖的的鸿鸿