对于零售信贷场景,传统数据主要指银行信贷业务办理过程中正常收集的业务数据,包括客户信息、贷款申请信息、产品信息、合同信息、借据信息以及放款后的提款信息、还款信息、逾期信息等,通常传统数据由实际的业务系统进行采集和存储。
大数据概述
除了传统数据,金融大数据应用越来越普遍,金融大数据即非传统数据,大数据与小数据的比较如下所示:
小数据大数据收集目的小数据是为特定的、明确的分析目标,制订规划并进行收集、整理、分析的数据,数据与分析目标之间有强逻辑业务关系,小数据亦称强关联数据大数据不一定有明确的分析目标,收集数据范围更广,与业务的关联性弱,大数据亦称弱关联数据数据结构来自不同行业领域,种类复杂,标准和格式种类单一、结构统一,一般是结构化数据一般以非结构化数据、半结构化数据为主生命周期比较短,几乎只有几年时间,待相关问题解决之后,生命周期结束生命周期可以很长,甚至会永久保存分析方法一般采用统计方法进行分析,更关注因果关系数据量大、结构复杂,一般通过分布式方法进行分析,并不严格追求因果关系分析重点一般以个体为分析对象,对个体数据信息进行全方位分析,更关注信息的深度一般以群体为分析对象,处理、分析大范围、大规模的数据,更关注信息的广度
金融大数据分类
大数据分类
- 按产生实体 - 个体活动- 业务流程- 传感器采集数据
- 按数据结构 - 结构化数据- 半结构化数据- 非结构化数据
- 按数据获取和处理方式 - 批处理- 流计算
银行内部大数据
内部大数据是银行内部可以自行采集的大数据,
类别****说明内部整合整合行内多系统,形成客户的全行统一视图埋点采集通过APP 或网上银行埋点,进行日志采集,特别是行为数据采集外部爬取通过爬虫技术,对外部公开、合法的数据源进行收集,包括但不限于新闻、舆情等场景收集一般以群体为分析对象,处理、分析大范围、大规模的数据,更关注信息的广度
银行内部采集大数据,需要考虑如下原则。
- 1)须确保所采集的数据有使用价值和分析价值,对业务决策和运营有价值。要有针对性地采集,最好有较明确的应用场景,不能为了采集而采集,导致采集到的数据不能发挥作用。
- 2)须具有一定的前瞻性,做好数据战略规划。例如,有些数据当前受限于分析条件和分析能力,暂时不能使用,需要提前进行规划和布局。
- 3)所有大数据收集都应遵守合规性要求,确保信息安全和隐私保护。
- 4)应具备配套的数据体系、数据治理、数据分析能力。
银行外部大数据
除了内部采集,通过采购或合作方式可以更直接和快速地获得外部数据
类别****说明金融信用信息基础数据库人行征信、百行征信、朴道征信等合法征信机构政府信用信息数据库
主要包括:
1)政府各部门的信用信息,包括司法、质检、药监、环保、税务等
2)国家企业信用信息公示系统,如信用中国
3)地方政府的征信信息
随着国家建立“大数据局”,越来越多的政府数据被统一汇总并对社会有条件开放
第三方平台数据信息主要包括电商、电信、银联、社交网络、网络行为、外部风险评分产品以及其他数据
需要特别注意的是,对于个人征信数据,因为其特殊性,只有政府机构和合法的持牌的个人征信机构才可以采集、存储并提供对外服务。
版权归原作者 水木流年追梦 所有, 如有侵权,请联系我们删除。