1、 2022 年中国湖仓一体平台市场研究报告 报告编委 报告指导人 黄勇 爱分析 合伙人&首席分析师 报告执笔人 孟晨静 爱分析 分析师 2022 年中国湖仓一体平台市场研究报告 目录 摘要1 1.湖仓一体架构介绍.2 1.1.大数据平台架构进入湖仓一体时代.2 1.2.实现湖仓一体的两种路线:湖上建仓和湖仓融合4 1.2.1.湖上建仓4 1.2.2.湖仓融合.5 1.2.3.湖仓融合是湖仓一体架构的未来.7 2.湖仓一体平台软件市场规模.8 2.1.湖仓一体平台软件定义.8 2.2.中国湖仓一体平台软件市场规模.9 2.3.湖仓一体平台软件厂商能力要求10 2.4.湖仓一体平台软件厂商全景图.
2、11 2.5.湖仓一体平台软件市场份额.12 2.6.代表厂商介绍.14 2.6.1.科杰科技.14 2.6.2.Databricks.15 3.对湖仓一体厂商的建议.16 3.1.重点关注云原生、DataOps 和 Data Fabric 与湖仓一体平台的融合.16 3.1.1.云原生技术能够极大释放湖仓一体平台的价值.16 2022 年中国湖仓一体平台市场研究报告 3.1.2.DataOps、Data Fabric 能够放大湖仓一体平台的应用价值,提升湖仓一体平台的竞争优势.16 3.2.重点布局金融,关注制造、交通等潜力行业.17 版权声明.19 关于爱分析.20 研究与咨询服务.21
3、2022 年中国湖仓一体平台市场研究报告 北京爱分析科技有限公司 1 摘要 l 为适应数据应用需求,大数据平台架构持续演进,历经数据仓库、数据湖两个阶段。2020 年,湖仓一体概念提出,湖仓一体架构因能实现数据资产统一管理、降低数据冗余、降低大数据平台架构运维复杂性,将成为大数据平台的主流架构。l 根据爱分析调研,2022 年中国湖仓一体平台软件市场规模 15.2 亿元。其中,科杰科技市场份额占比 11.1%,华为云占比 9.5%,星环科技占比 7.3%。爱分析预测,2025 年,中国湖仓一体平台软件市场规模将达近 100 亿元,2022-2025 年三年复合增长率为 86%。图表 1 湖仓一
4、体平台软件市场规模及增速 图表 2 2022 年湖仓一体平台软件市场份额占比 (数据来源:市场调研、爱分析测算)(数据来源:市场调研、企业年报)l 湖仓融合作为湖仓一体的先进架构,在 ACID 事务性、存算分离、批流一体、元数据统一管理等方面具有明显优势,未来将成为湖仓一体架构实现的主流技术。l 要在竞争激烈的湖仓一体市场取得成功,厂商应当重点关注云原生、湖仓融合、Data Fabric、DataOps 等能力的构建,以上能力将构成湖仓一体平台软件的技术壁垒。在布局上,需重点布局金融业,同时关注工业、交通等潜力行业。2022 年中国湖仓一体平台市场研究报告 北京爱分析科技有限公司 2 1.湖仓
5、一体架构介绍 1.1 大数据平台架构进入湖仓一体时代 随着数据量级持续扩展,数据类型多元化,以及数字化转型深入企业数据应用场景变得日益复杂,业务对于数据实时性的要求需要企业兼具批处理、流处理能力;复杂的业务类型又需要企业同时具备描述性分析、预测性分析、诊断决策性分析以及探索性分析等能力。相较数据仓库、数据湖,湖仓一体更能完全满足数字化转型企业对大数据平台的各种需求。这也预示着大数据平台架构历经数据仓库、数据湖两个阶段后,正式进入湖仓一体新时代。图表 3 大数据架构演进驱动因素 1)企业数据分析需求推动数据仓库出现 20 世纪 90 年代,为满足企业敏捷数据分析需求,基于联机分析处理(OLAP)
6、的数据仓库概念开始出现并迅速发展。数据仓库能解决分散数据源的集成、分析问题并作为第一代数据分析平台开始被大范围使用。图表 4 数据仓库示意图 2022 年中国湖仓一体平台市场研究报告 北京爱分析科技有限公司 3 2)海量异构数据的分析需求促使大数据平台进入数据湖阶段 21 世纪互联网时代,社交媒体、搜索引擎等新应用层出不穷,为数据应用场景带来剧烈变化,数据体量从 GB 级提升至 TB 和 PB 级,原有大数据平台架构的可扩展性远远无法满足计算需求。同时文本、图像、语音等非结构化数据量急剧增长,异构数据低成本存储对大数据平台提出了新的挑战。数据湖以极低成本实现任意格式数据的统一存储、管理和分析,