当前位置:首页 > 报告详情

郑锴-数据湖存储架构选型_compressed.pdf

上传人: li 编号:29786 2021-02-07 22页 728.95KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了数据湖存储架构的选型,以阿里巴巴为例,阐述了数据湖存储/加速的挑战,并给出了一份“完美”选项的checklist。文章指出,数据湖是当前的趋势,能统一、集中地存储全部原始数据,支持结构化、半结构化、图像/视频/音频等数据的分析。同时,数据湖还需支持BI+AI的分析,不仅限于SQL。在存储方面,数据湖存储架构需要支持对象存储,具备大规模存储能力和大目录元数据操作能力。此外,还需支持策略灵活的缓存加速能力,和计算打通优化能力,支持数据湖新型表格存储的能力,归档/压缩/安全存储的能力,以及全面的大数据+AI生态支持。最后,文章以阿里云上的JindoFS为例,介绍了其在大数据存储和加速方面的优化措施和性能优势。
数据湖存储挑战有哪些? 如何打造完美数据湖存储? 阿里云JindoFS如何优化数据湖?
客服
商务合作
小程序
服务号
折叠