当前位置:首页 > 报告详情

5.快手元数据平台化建设及应用场景-薛言.pdf

上传人: li 编号:29756 2021-02-07 26页 5.24MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了快手元数据平台化建设及应用场景。作者薛言是大数据平台架构师,负责元数据系统建设及应用加入快手3年。文章首先解释了元数据的概念,即关于数据的数据,包括数据的组织、数据域及其关系。然后,作者详细阐述了数据治理的驱动方式,如资源治理、规范治理等,并提出了如何衡量治理效果的问题。接下来,作者描述了元数据系统的早期发展阶段和现状,包括Hive、Kafka、Druid等平台的能力,以及MySQL、Redis、ES等存储方式。此外,文章还讨论了如何抽象和管理元数据,以及如何构建全链路数据血缘,提供实时血缘查询能力。最后,作者提出了未来规划,包括提高元数据质量、提供更细粒度的血缘解析能力、改善搜索体验和离线分析能力等。
什么是您提到的'元数据'?" 如何确保海量数据资产的安全与合规?" 如何通过数据血缘技术优化数据管理?"
客服
商务合作
小程序
服务号
折叠