《2019年微博广告运维与监控技术实战.pdf》由会员分享,可在线阅读,更多相关《2019年微博广告运维与监控技术实战.pdf(33页珍藏版)》请在三个皮匠报告上搜索。
1、全球敏捷运维峰会广州站微博广告运维与监控技术实战全球敏捷运维峰会广州站TABLE OFCONTENTS 大纲运维在广告体系中的价值复杂业务场景下的运维建设之路海量指标监控平台Oops实践全球敏捷运维峰会广州站运维体系发展阶段全球敏捷运维峰会广州站运维在微博广告中的价值业务可用性提高效率优化系统系统性能评估故障迅速定位应急事件处理请求链路跟踪代码快速迭代指标走势预测全球敏捷运维峰会广州站TABLE OFCONTENTS 大纲运维在广告体系中的价值复杂业务场景下的运维建设之路海量指标监控平台Oops实践全球敏捷运维峰会广州站服务治理全球敏捷运维峰会广州站服务治理减少故障链路跟踪资源合理利用性能优化
2、快速降级平台化自动化快速变更智能化快速扩容效率优化全球敏捷运维峰会广州站服务治理全球敏捷运维峰会广州站服务治理 服务多机房均衡部署 多运营商分布 机房承载冗余 流量分布均匀 上下游同机房请求100+服务3+机房/运营商1.5倍流量冗余环境标准化全球敏捷运维峰会广州站服务治理某产品线性能压测全球敏捷运维峰会广州站自动化运维平台快速扩容快速降级快速变更管理有序提高效率安全操作全球敏捷运维峰会广州站自动化运维平台Kunkka全球敏捷运维峰会广州站自动化运维平台多环境编译自动打包自动化测试自动部署动态扩缩容多级审核全球敏捷运维峰会广州站有效的报警如何提高报警的有效性,减少误报?全球敏捷运维峰会广州站有
3、效的报警全球敏捷运维峰会广州站全链路Trace系统日志格式与解析全球敏捷运维峰会广州站全链路Trace系统C l i ckH ouseC l i ckH ouseFi l ebeatFi l ebeatFl i nkFl i nkkaf kaAppl i cati on数据收集与处理全球敏捷运维峰会广州站全链路Trace系统业务查询全球敏捷运维峰会广州站全链路Trace系统全球敏捷运维峰会广州站TABLE OFCONTENTS 大纲运维在广告体系中的价值复杂业务场景下的运维建设之路海量指标监控平台Oops实践全球敏捷运维峰会广州站监控平台的挑战延迟偏差不稳定全球敏捷运维峰会广州站监控平台的目标
4、全球敏捷运维峰会广州站整体架构Oops全球敏捷运维峰会广州站自动化采集全球敏捷运维峰会广州站自动化采集性能压测配置参数单节点1核CPUSnappy压缩kafka partition=10required_acks=124000 TPS27 Mb/s失败日志数为 0flush.min_eventsclose_inactivescan_frequencyignore_olderclean_inactiverequired_acksbulk_max_sizecompression全球敏捷运维峰会广州站配置化清洗全球敏捷运维峰会广州站实时指标仓库不同时间粒度的查询不同业务维度的组合提高查询相应速度复杂业务逻辑定制数据复用原始层聚合层全球敏捷运维峰会广州站实时指标仓库原始表指定字段聚合聚合表全球敏捷运维峰会广州站实时指标仓库全球敏捷运维峰会广州站实时指标仓库14千亿条,120TB数据量处理日志最大QPS125w任意多维聚合查询单表最多155字段秒级可视化粒度全球敏捷运维峰会广州站指标可视化全球敏捷运维峰会广州站监控平台的一些成绩全球敏捷运维峰会广州站THANK YOU!