当前位置:首页 > 报告详情

使用 DLT 进行高效的近实时事件摄取:见解和经验教训.pdf

上传人: 张** 编号:167685 2024-06-15 25页 1.04MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
Nextdoor是一家致力于通过连接邻居和现实世界联系创造更友善世界的公司,业务遍及美国、加拿大、欧洲和澳大利亚,拥有超过4300万周活跃用户。Nextdoor运行在AWS云上,正在招聘员工。Nextdoor的事件摄取管道在使用DLT之前,通过HTTP服务将事件发布到每个区域的Kafka主题,然后通过Kafka连接应用程序将数据倾倒到S3存储桶,AWS Lambda对事件进行分区并将数据写入另一个S3桶。之后,每小时的Airflow作业将分区添加到HiveMetastore。在采用DLT后,Nextdoor的摄取管道实现了近实时的事件摄取,提高了数据分析的效率,并将事件交付的保证从至少一次提高到了精确一次。然而,在开发过程中遇到了内存不足、目录列表引起的问题、Spot终止等问题。通过调整自动加载器的配置、采用按需实例、合并DLT表和分区等措施,Nextdoor成功优化了摄取过程,降低了计算成本,提高了数据新鲜度,并获得了更好的查询性能。
"Nextdoor如何通过DLT提高事件摄取效率?" "Nextdoor在采用DLT过程中遇到了哪些挑战和解决方案?" "Nextdoor的DLT摄取管道对数据平台和业务有何积极影响?"
客服
商务合作
小程序
服务号
折叠