当前位置:首页 > 报告详情

4-3 StarRocks 构建实时数仓的新探索.pdf

上传人: 云闲 编号:102390 2021-01-01 42页 11.27MB

1、StarRocks构建实时数仓的新探索2022-03-24 王天宜|StarRocks 实时数仓户案例录|01020304实时数仓经典架构与特点StarRocks 实时数仓产品定位StarRocks 实时数仓建模式实时数仓经典架构与特点|实时数仓 1.0-Storm 架构SpoutBoltBoltBoltSpouttuplestuplestuplestuples|实时数仓 2.0-Lambda&Kappa 架构Kappa 架构批处理实时处理计算引擎数据服务服务层数据存储结果数据历史数据Lambda 架构应层实时 分析实时 屏实时 推荐实时 查询应层实时 分析实时 屏实时 推荐实时 查询数据存储

2、结果数据历史数据实时处理计算引擎数据服务服务层|实时数仓 3.0-Flink 架构数据采集户为业务数据系统志爬数据数据源实时应实时分析实时屏实时查询实时推荐消息队列数据存储KafkaPulsarCanalFlumeLogstashDebezium|StarRocks实时数仓定位与产品能实时数仓新挑战数据采集户为业务数据系统志爬数据数据源实时应实时分析实时屏实时查询实时推荐消息队列数据存储KafkaPulsarCanalFlumeLogstashDebezium数据传输链路 链路冗,数据经过采集层,消息队列,Flink 分析层存储 技术栈复杂,多种数据存储引擎配合功能性缺失 数据更新能弱,查询并

3、发量低,去重困难|StarRocks 在实时数仓态定位实时应实时分析实时屏实时查询实时推荐户为业务数据系统志爬数据数据源数据采集MySQL维度数据FileStarRocks数据湖LogstashDebeziumCanalODSDWSDWDODSODSODSDWSDWSDWDDWDODSODS|StarRocks 实时数仓能实时数据摄 直接订阅 Kafka 数据 提供 Flink-Connector,Exactly Once Flink CDC 直接捕获 TP 数据变更实时数据更新 PK 模型提供 Delete and Insert 更新式 性能相 Merge on Read 提升 3-15 倍

4、实时数据建模 聚合模型提供实时聚合能 向量化引擎,实时 Join 能撑多种模型 提供物化视图实现抢致性实时数据分析 产后的数据可以直接使 实时、离线数据统融合数据源实时应报表业务指标监控客群圈选智能分析MySQLFile维度数据ADSODSDWDDWSADSODSDWDDWSADSDWSStarRocksODSDWD数据湖数据采集CloudCanalFlumeLogstashBI 业务户为业务数据志系统爬数据|StarRocks 实时数仓能实时数据摄 直接订阅 Kafka 数据 提供 Flink-Connector,Exactly Once Flink CDC 直接捕获 TP 数据变更实时数据

5、更新 PK 模型提供 Delete and Insert 更新式 性能相 Merge on Read 提升 3-15 倍实时数据建模 聚合模型提供实时聚合能 向量化引擎,实时 Join 能撑多种模型 提供物化视图实现抢致性实时数据分析 产后的数据可以直接使 实时、离线数据统融合数据源实时应报表业务指标监控客群圈选智能分析MySQLFile维度数据ADSODSDWDDWSADSODSDWDDWSADSDWSStarRocksODSDWD数据湖数据采集CloudCanalFlumeLogstashBI 业务户为业务数据志系统爬数据|StarRocks 实时数仓能实时数据摄 直接订阅 Kafka 数

6、据 提供 Flink-Connector,Exactly Once Flink CDC 直接捕获 TP 数据变更实时数据更新 PK 模型提供 Delete and Insert 更新式 性能相 Merge on Read 提升 3-15 倍实时数据建模 聚合模型提供实时聚合能 向量化引擎,实时 Join 能撑多种模型 提供物化视图实现抢致性实时数据分析 产后的数据可以直接使 实时、离线数据统融合数据源实时应报表业务指标监控客群圈选智能分析MySQLFile维度数据ADSODSDWDDWSADSODSDWDDWSADSDWSStarRocksODSDWD数据湖数据采集CloudCanalFlum

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
StarRocks构建实时数仓的新探索文章主要介绍了StarRocks实时数仓的产品定位、建模方式、性能提升以及实际应用案例。文章指出,StarRocks实时数仓能够直接订阅Kafka数据,通过Flink-Connector实现Exactly Once的数据处理,并提供实时数据更新能力。相较于传统的数仓架构,StarRocks实时数仓在性能上有了3-15倍的提升。文章还提到了StarRocks数据建模的能力,包括支持实时、批量构建、灵活增加删除以及支持Schema Change等。在实际应用案例中,小红书基于StarRocks构建了广告数据中心,实现了广告曝光点击流的实时分析。此外,StarRocks还提供了物化视图实现一致性实时数据分析,以及支持实时、离线数据统一融合的数据源。总的来说,StarRocks实时数仓为用户提供了一个高效、灵活的实时数据处理和分析平台。
StarRocks如何实现实时数仓的构建和优化? StarRocks如何通过向量化引擎和实时Join能力,实现实时数据分析的加速? 面对实时数仓的挑战,StarRocks如何实现数据采集、存储和分析的高效整合?
客服
商务合作
小程序
服务号
折叠