第7章 数据质量管理
数据质量用以描述数据对使用者有价值和有用的程度。从本质上来说,数据质量问题是信息失真的表现,不同程度上影响了银行相关业务的开展,导致客户满意度下降,同时也降低了统计信息的可用性。因此,必须从各阶段人手进行数据治理,防范信息失真,有效提高数据质量。
数据质量问题产生的因素有多个方面,主要有设计问题、传输和使用问题、操作问题等方面。正因为数据质量产生于多个方面,因此其治理的难度不言而喻,例如:
1)由于历史原因造成大量缺失数据和错误数据,比较典型的就是早期银行开户时对客户信息控制不严格,从而造成客户信息缺失或错误。
2)需求考虑不周导致数据质量问题的产生。需求人员在拟定需求时,往往从当前使用场景出发,对后续使用场景以及与其他系统之间的关联关系考虑较少,出现系统间数据不一致,当前数据无法满足新业务场景使用等情况。
3)操作不合规形成数据问题。操作人员在操作时错误或不严谨,也会导致问题产生,比如输入随意的11位数字用作手机号码等。
只有数据质量提高了,才能更好地服务客户,提升银行经营管理水平。例如,完整的客户信息可以有效地分析客户行为,给客户提供更为全面的服务;系统间一致的数据可以提升数据的共享程度等。