智能风控平台:架构、设计与实现
上QQ阅读APP看书,第一时间看更新

1.1.2 什么是大数据风控

大数据风控即大数据风险控制,是指利用大数据构建模型的方法对风控目标进行风险的控制和风险提示。大数据风控中大数据、模型作为核心要素在风险控制中起着关键的作用,抽象出来就是图1-5所示的大数据风控模型图。

图1-5 大数据风控模型图

大数据风控模型也是大数据风控的核心流程。首先将大数据输入风控模型,由风控模型通过决策引擎系统进行数据的运算和策略决策,最终通过决策引擎输出风控结果或者风险提示。

互联网时代,大量的数字信息被记录、存储下来,形成了一个巨大的数据库。通过对这些数据进行大规模的运算、深度的挖掘,提炼出可用的有价值的信息,指导风险控制,提升风险控制质量和效率。互联网时代催生了风控技术的多样化,推动了风控技术的发展。

大数据风控与传统风控的基础理论本质没有发生大的变化,都是对目标信息的决策。相比传统风控,大数据风控的优势是数据量大、数据维度丰富、风控客观、效率高、适用范围广。

1.数据量大

互联网的发展带来了数字信息的爆发式增长,根据IDC预测,2017年全球的数据总量为21.6ZB(1ZB等于270B),预测到2025年全球数据总量达到175ZB,我国的数据量将达到48.6ZB(1ZB等于260B)。拥有了足够多的数据,基于大量数据的风险挖掘才有用武之地。大数据是支撑大数据风控的基础。

2.数据维度丰富

大数据通常分为结构化数据、半结构化数据、非结构化数据三种类型。结构化数据指能够用数据或者统一结构来表示的信息,是高度组织和整齐格式化的数据,业界多指关系模型数据(即用关系型数据库管理的数据),如姓名、身份证、电话号码、地址等。半结构化数据是介于结构化数据与非结构化数据之间的数据,是数据的结构和内容混在一起、没有明显区分的一种自描述信息,如XML、JSON等文档数据。非结构化数据是没有固定结构的数据,即在数据库中的字段长度不可控,如Word文件、图片、视频、语音等数据。大数据的三种类型包含个人数据、行为数据、社交数据、事件数据、机器和传感器数据等多维数据。大数据风控根据多维数据实现目标全面的风控画像,输出丰富的风险特征,实现全面的风险控制。丰富的数据维度助推了风控的多元发展。

3.风控客观

大数据风控不仅包含传统风控的经验判断,还包含非传统风控的数据分析和决策,它采取技术手段对多维数据进行客观分析、评审,覆盖尽可能多的风险因子以确保风控的全面性。大数据风控在运行逻辑上弱化事物的因果关系,更强调统计学的相关性,可以有效地避免人为主观判断造成的失误。客观风控更能确保风控的准确性。

4.效率高

大数据风控可以通过技术方法进行数据的实时采集,使用预制的风控模型对采集的数据进行实时的风险评级,实现秒级的风控结果输出、对风险的毫秒级处理。大数据风控省去了传统风控烦琐的风控流程,提高了风控的效率。

5.适用范围广

传统风控根据具体的垂直行业进行风险控制方案的输出,其方案存在特殊性和唯一性,导致适用范围受限,且传统风控受限其垂直领域的数据,例如金融信贷风控,传统风控方案在征信数据缺失的时候,就会面临风险无法定性、定量的尴尬局面。但大数据风控在征信数据缺失时,可以通过对客户的其他数据(如消费数据、行为数据、个人基本数据、社交数据等)进行风险的定性和定量分析,最终输出风险评级,因此大数据风控适用范围更广。