中国工商银行股份有限公司软件开发中心信息科技专家王晓平 图片来源:中国网财经
中国网财经9月9日讯 第十七届中国金融发展论坛9月8日-9日在京召开。中国工商银行股份有限公司软件开发中心信息科技专家王晓平在会上发言,我们原来采用传统的技术,大多数只能通过事后的监控和营销,满足不了风控的时效性和变化性的要求。随着新的产品推出的频次越来越高,各种组合产品也是层出不穷,对我们来说怎么通过新技术、新方式来防空这些新的风险的交叉感染,对各个渠道的风险防范也提出了更高的要求,原来被动的风险防控的方式已经难以满足我们的要求。
以下附发言全文:
王晓平:谢谢安总,也欢迎各位嘉宾、各位领导来聆听我的演讲,我演讲的题目是技术与数据为先,攻坚风控建设。工商银行原来的董事长江建新先生一直说,银行最宝贵的财富是数据,他说未来成功的银行一定是数据大行,所以作为工商银行是有全世界最大的客户群体和最多、最真实的客户实时的交易数据,所以怎么能够把银行大量的数据结合起来,用我们的新技术去为银行服务,是我们银行的核心竞争力。因此我后面的演讲主要是围绕怎么运用新技术,利用银行的数据,结合大数据、云计算、区块链、人工智能等方式,去打造我们新的风控体系。
应该说工行大数据的体系整个技术平台也是超过了十年的建设进展,从最初的专有的集中式的体系,逐渐走向了分布式、开放式的体系架构。工行从2000年开始建设了企业数据仓库,当时还只是一个数据分析工具,当时业界比较普遍的Oracle的体系,对业务报表、数据方面进行发展。2007年,工商银行引入了世界上专业的数据仓库硬件体系架构,包括数据仓库的体系模型。
随着数据仓库体系的建设,逐渐引入了专业的大数据处理的系统,随着互联网金融以及开放式平台的发展,2013年以后,工商银行的数据体系架构逐渐转向了开放式、分布式以及开元的体系架构,2014年工行自主研发了基于流数据处理平台。这是工商银行数据体系的概略图,可以看到最下层是工行把我们银行的数据以及和互联网金融相关的客户行为、数据纳入进来,还包括一些相关的数据源,实现了大数据平台实时、准时以及批量计算的能力,把它们包装成相关的数据服务的能力,包括灵活查询、信息检索,以及相关的模型定制的功能,为我们在风控、营销以及客户服务相关领域,提供了大数据的服务支持。
在工行的数据体系方面,结合新技术,主要是从2014年开始,逐渐从高成本、封闭的专有平台,向开放式的高性价比的可扩展、开放设备进行转型。在转型前,工商银行主要是基于Teradat、Oracle为主的专有平台;在转型后,主要以多技术平台的云服务平台为主,引进新技术,打造了能够支持准时、实时和批量的多种技术的大数据技术平台。
在大数据时代下,数据为什么大呢?最主要还是因为我们引进了非结构化的数据,所以工商银行也加强了非结构化数据的处理能力,建设了工行的信息库,主要处理非结构数据化的信息,目前已经纳入了工行的大数据体系。另外在外部的互联网信息方面,我们也自主搭建了一个塔网系统,把主要相关网站的信息以及目前比较重要的微博信息纳入我们的信息库,进行统一的信息检索和相关的分析,为我们后续的一些运行分析、风险监控提供了支持。
在快的方面,因为目前来说互联网金融发展信息瞬息万变,所以客户对我们的信息的需求越来越快,原来的7+1或者更长时效地要求已经满足不了客户的需求,所以我们也自主搭建了工行的流数据平台,可以提供毫秒级的数据能力,包括事件触发式营销、事前事中的信息处理发挥了重要作用。
我们觉得可以考虑基于区块链的技术,搭建一个跨金融机构、金融产品的交易平台,能够改善金融机构间相对来说比较集中的效率低下、成本比较高的问题。有两个场景,第一个是通过这个跨机构的金融产品交易平台,在B2C的领域,金融机构作为一个发布产品的平台,客户通过这个平台购买自己需要的产品。另外在C2C方面,客户可以通过这个平台直接购买产品,满足自己的需求。当然目前区块链技术还存在一些缺陷,需要进一步研究,目前工行也在进行相关技术的一些探索。
银行业随着互联网时代方兴未艾的技术发展,面临一个全新的形势,不单单是对工行,对整个银行业也都存在着一些变化和挑战。目前渠道越来越多样化,产品创新越来越快,现在的技术发展也是越来越快,所以一些高科技、专业化的技术也是层出不穷。带来的挑战就是我们原来采用传统的技术,大多数只能通过事后的监控和营销,满足不了风控的时效性和变化性的要求。随着新的产品推出的频次越来越高,各种组合产品也是层出不穷,比如说我们在银行这边了一个理财产品,我们可以把这个产品做一些组合,也可以做一些相关的质押;包括最近的二维码支付、第三方支付也是层出不穷,对我们来说怎么通过新技术、新方式来防空这些新的风险的交叉感染,对各个渠道的风险防范也提出了更高的要求,原来被动的风险防控的方式已经难以满足我们的要求。
工行的风控体系建设也是经历了十多年的历程,从2008年开始就已经尝试进行相关的信用评分的公司,包括我们在非零售、零售信用评分方面,用一些逻辑回归的比较传统的数据处理的技术进行风控,之前主要还是凭借着专家的经验,或者一些传统的数据挖掘的方式进行风控。进入了2000年以后,我们逐步走向了采用量化数理模型的方式来防控风险,这两年随着新技术的发展,包括人工智能新技术的发展,我们也逐渐尝试采用神经网络在事前、事中防范风险,实时地防范客户的反欺诈和一些风险行为。
我们工商银行在风险防控的数据体系架构,主要的数据源不单单是我们传统银行业的交易数据,也涵盖了目前工商银行在打造的三大平台的互联网金融的相关数据,还包括了一些政府机关和合作方的价值,形成了三流合一,资金流、商品流和信息流,把相关的数据进行整合、交叉应用,形成了风险架构体系的信息库,包括为客户做客户画像,包括把全行的风险事件进行统一管理,和各个渠道产品线的分享,形成风险的事件库,并且通过我们统一的策略库布控到各个业务系统和风控系统当中。然后再通过我们一些新的技术,采用实时的计算引擎和模型的引擎,还有批量的计算引擎,在风险防控领域、信用卡第三方监控的领域,进行相关的一些客户服务。
下面简单介绍一下,通过之前介绍的新技术的应用,工商银行取得的一些初步的成果。首先就是我们在风控领域利用了自主研发的新技术,采用多管齐下的方式,实现了毫秒级的反欺诈,通过交易特征分析是否有反欺诈的风险,让客户填写确认信息,通过客户进行短信或者电话的确认,防止客户受到反欺诈或者相关的风险防范。从去年到今年,通过这种实时地反欺诈技术,为银行和客户取得了比较好的效果。
第二个,目前银行在信贷领域存在着比较大的风险,信贷领域的质量也是目前银行业工作的重中之重。工行也是基于海量的数据基础,通过一个大数据的体系架构,运用大数据的数据处理和模型挖掘的能力,去发现信贷监控中心的数据挖掘风险体系的架构,主要把我们相关的行内外的数据,通过集中的分析和挖掘,通过交叉违约、资金流向等模型进行深度挖掘客户可能存在的风险,通过客户的准入和事后的监测、防范当中,发现信贷方面的风险,提升信贷质量。
接下来一个案例就是采用类似于人工智能的方式,来防范小微企业的风险,主要采用KNN的算法,创新设计小微企业现金流量、现金流向、风险预警、经验指标等四大类22个风险因子,共计95项指标的风险预警模型体系。通过KNN的算法,可以看到基本上会和好人打交道,如果是有家企业发生了比较大的风险,跟他有比较大的关联关系的话,本身这家企业也是需要我们去关注和防范的,通过我们的关联关系的组建,以及通过交叉风险的识别,能够比较好地提前进行小微企业融资风险的预警。
通过我们这些大数据的分析、挖掘,我们也能够通过一些包装,就是工行通过打造融安e信的风险防控产品,向业界提供风险信息的服务。工行运用大内存的数据库,结合了八大权威机构的20类的名单,以及违反企业信息,包括工行在交易过程当中自己发现的涉及到的风险信息,统一包装了风险信息的服务,通过融安e信的产品,给相关的同业银行提供相关服务,也是起到了非常好的效果。
另外在新技术方面,还有一个大数据可视化的分析,大家在阿里巴巴的光棍节等大的促销活动当中,大家都会看到通过大数据的可视化的技术,能够快速地获取到我们想要获取的信息,了解一些需要的数据。工行也是运用了大数据可视化的技术,实现了全行的信用风险可视化的监控,为我们行领导,包括业务人员能够一目了然地了解目前全行的信贷风险状况。这个可视化的风险也是在李克强总理到工行调研的时候,给总理做了一个演示,达到了比较好的效果。
后续的展望,应该说随着经济以及技术的发展,作为银行来说,必须结合数据和新技术,不断提升银行的风险防控的能力,实现向数据驱动的全新模式的转变。工行主要会在以下四个方面发力,第一个是完善建立客户画像,整合共享风险信息,支持跨渠道、全产品、全流程的联动防控。第二个是引入关联分析及可视化技术,提升全渠道、全产品、全流程的风险防控能力;第三个是依托流数据技术及自学习智能模型,实现交互式柔性防控客户体验。第四个是在个渠道做好数据埋点,捕捉客户位置和行为等,提升风险识别的准确率,为客户提供更好、更满意的服务。以上就是我的介绍,谢谢大家!
(责任编辑:邱艳)