《A2--赵先炮--大促狂欢背后的质量守护体系与团队效能升级之路.pdf》由会员分享,可在线阅读,更多相关《A2--赵先炮--大促狂欢背后的质量守护体系与团队效能升级之路.pdf(43页珍藏版)》请在三个皮匠报告上搜索。
1、大促狂欢背后快手电商质量守护与效能跃迁之路赵先炮快手电商营销质量负责人赵先炮快手互联网从业经验 10+,当前在快手电商担任营销质量负责人,负责营销导购中心质量保障、大促质量保障、电商质量度量及故障演练等工作。目录CONTENTS被动救火0102 体系保障智能增效03PART 01被动救火业务&技术的双重压力稳定性挑战业务大V直播大促活动技术单元化服务分组架构升级限流降级熔断报警策略白盒化需求变更电商业务架构高流量近百万下单请求,近千万级人同时在线高性能直播间福利品抢购场景高性能要求高可用服务端可用性3个9以上限流避免流量超限,请求排队提供良好限流体验高体验电商业务特点牢固稳定性、流畅性能体验、
2、追求低成本单热点商品库存扣减难题用户下单体验需改善数据一致性实时性要求高业务体量增长带来成本上升营销玩法迭代导致的复杂度提升快手大V有1亿+粉丝,经常推出库存为几百万的低价商品,造成业界最高的单热点商品扣减流量问题。直播间福利品抢购场景,流量远超过系统承载流量,超大流量下抢购场景对用户体验带来极大影响,限流排队重试提升体验是快手电商不断改进的目标。百万单福利品抢购场景,用户下单后的链路:如订单查询,商家操作订单等异步链路,对数据一致性、实时性提出高要求。业务持续高速发展,随着时间积累,数据量成指数级增长,数据量的提升也带来一系列问题,成本升高、性能变差等。活动优惠玩法层出不穷,各种优惠玩法叠加
3、,互斥,规则,对象等多重维度增加业务的复杂性,交易模型要求能够快速支撑各种灵活的定制逻辑。面临的问题质量状况PART 02体系保障初建保障体系压测功能交付内测&公测功能预演大V保障降级演练迭代演变成成功能交付、内测&公测、预演、压测、大V保障、故障演练的组合拳保障方式 功能交付:需求的交付协同 内测&公测:大促活动的整体验收 预演:大促玩法和核心链路的全集成覆盖 压测:流量评估、全链路压测及限流体验保障 大V保障:大V直播功能预演 降级演练:活动降级方案的演练项目交付 以项目的交付时间为起点 梳理全节奏里程碑,全员协同质量保障电商-双1138女神节:问题 41个+高优 19个+值守 5点秒杀进
4、度条不更新底导分辨率异常海景房不展示券体验问题频发压测数据10+个直播预告,线上请求近百个预告的查券内测&公测推荐重复推荐结果不稳定报名流程繁琐模版化公测&内测关健点准出标准核心玩法覆盖核心玩法全部参与内测,2轮+,准出要求P2+问题全部修复数据真实会场、商家商品报名、推荐的数据全是真实的线上数据(非测试),数据量级和线上一致对招商数据进行时光机迁移,活动未正式开启前能提前透出主播及商品;推动运营提前完成相关配置,并对质量把关玩法真实玩法的内测至少有一轮和最终用户的真实玩法一致,如平台券配置、抽奖奖品等配置真实直播间、买家首页、搜索、挂件、Banner位、底导等配置类资源位和线上一致,产运需提
5、前进行资源位配置,并同步测试主R对配置进行验证资损点覆盖需求涉及交易(正向、逆向、物流)、营销(平台券、商家券)、风控(拦截场景、规则)均需要做资损利益点的用例评估数据链路覆盖数据需在大盘链路中进行验证,包含新客、老客、不同用户画像、商家流量的消耗等,包含ToC、ToB的链路问题决策修复所有问题(功能、体验、性能)当场主R共同决策,其中体验类问题需上升决策,P1级以上问题需日清问题跟进提前拉内测群集中沟通,根据群里反馈进行Team的在线记录,需包含上报人、截图、视频等关键信息内测运营申请预算,在研发、测试、项目全员群进行内测前的通知参与人员开发主R、产品主R、运营主R、测试主R、设计主R均需要
6、参与内测和问题的决策修复预演质量保障只关注大促玩法本身,对日常的核心链路关注不够 大促玩法+核心链路 100%全覆盖 最高规模的集成,集中把功能、体验、性能等问题暴露出来并提前验收优 化全链路压测非全链路数据易污染构造困难配置复杂仿真度差安全性差压测数据无法清除Kstable配置复杂读线上写影子的压测方案与真实场景天然存在差距,对压测仿真度有差异数据仍然做不到百分百的完全隔离,还是会有存在对线上数据污染的风险,安全性差电商写请求多,压测数据存在线上表,无法快速清除,无法快速构造当前影子方案配置是基于链路维度,配置成本高,操作复杂早期读线上、写影子压测调研稳定性压测方案高数据隔离无影子表线上表压