《IBM:溯本清源:以精准的数据应对反洗钱监管(7页).pdf》由会员分享,可在线阅读,更多相关《IBM:溯本清源:以精准的数据应对反洗钱监管(7页).pdf(7页珍藏版)》请在三个皮匠报告上搜索。
1、数据业务规范的编制,首先需要识别归并重复数据项,删减未启用数据,然后对数据项予以规范命名并进行分类编码。其次,结合监管报送规定、业务需求,对数据项的业务定义、是否必填、业务规则、长度精度、数据类型、代码值等进行梳理。最后,应建立数据项与落地表单设计之间的映射关系,将数据规范带回每张表单中,便于业务人员及科技人员直接使用。数据规范对识别数据项需求类型、查找数据项码值及转码关系、数据问题的根因分析及方案制定等提供支持。数据质量探查数据质量探查是主动探查当前真实数据的客观质量。质量探查的结果是数据现状和业务规范的差距,这个差距可作为数据问题补充,也帮助定位数据问题的节点所在。质量探查的数据源应具有一
2、定的时间跨度,以 3 个月以上数据为宜,避免数据量不足带来的偏差。数据质量探查分为普查和专项探查两个方面。普查是对全量数据的“地毯式”检查,例如空值率、最大最小值、最长最短值、代码项的码值分布等情况。专项探查则是结合业务规则探查数据间的深层次质量问题,例如数据项之间的交叉验证规则。数据质量探查的结果应与业务规范中的必填项、码值、业务规则等进行比对,并结合业务常识,判定其是否属于数据问题。经确认后是数据问题的,可将检核规则予以沉淀,并部署到数据质量管控工具中,开展源头数据质量的主动监控。问题根因分析根因分析是结合多种方式探寻导致表象问题的根本原因所在。例如,数据乱码,可能是系统抽取数据时处理错误导致、或脱敏处理导致,属于系统与技术的原因;也可能是在源头数据录入时录入了不符合规范的数据项,属于需求与规范的原因。根因分析应结合数据溯源、业务规范、质量探查开展。首先定位问题对应数据项的加工环节,随后与该环节的相关方共同沟通发生此数据问题的原因。