国美大数据中心总监 李少伟
大家好,我是来自国美金融的李少伟,主要负责国美金融大数据相关的业务。下面介绍一下国美金融本身,国美金融是国美控股旗下的一家从事金融投资和金融发展的综合性平台,现在主要是依托于国美产业优势,构建了消费金融、财富管理、企业融资包括支付四大品牌体系。
在消费金融主要有三款:一个是美易分,房车主要指的是新车、二手车的交易业务;财富管理包括美易理财,国美保险、国美基金;企业融有美易融,指的是供应链金融。大数据作为金融行业的核心资产,可以促进高频以及风险分析,满足互联网金融各种业务模式。
互联网金融不简简单单是把线下网点、线上帮线下,更重要是打破网点,有效拓宽了渠道,能够提供方便、快捷、高效的金融服务,可以提升效率。金融服务的低成本化,我的理解主要是体现在交易成本上,尤其是单笔贷款的审批成本。互联网金融主要是依托于大数据相关技术,利用电子商务、运营商、互联网用户在网上留下的信息,可以实现自动化、智能化的审批,可以提升信贷审批的效率,同时极大的降低了每一笔信贷的成本。
互联网金融领域的大数据主要集中在两方面的应用,一方面精细化的运营营销,还有是产品迭代优化,其实主要是提升我们的用户体验,互联网金融本质还是金融。说到金融有一个核心就是风控,加入用户全方位信息的数据通过大数据和技术的方法,同时极大提升了风控的效率。
大数据落地:渠道、获客和运营分析
整个大数据技术能力在国美金融的落地,一说到大数据金融能力,包括4方面,第一是大数据存储能力、计算能力,特别最重要是集合产品的应用能力,我们主要是从下面来说,主要依托于国美金融内部的数据,包括外部合作获取到外部的数据,基于信息工厂构建整合处理报告到转换成行业洞见的数据价值体系,包括风险控制核查,除此之外,我们构建了一套大数据,BI系统还有是分析体系,大数据风控就是反欺诈、决策引擎规,这包括计算引擎,精准营销主要是包括获新客、激活沉睡老客、刺激活跃客户复投、个性营销管理。说到大数据的运营、营销,如果按照CPS算,一个S基本在200以上,所以如何有效的获客,这是决定这一块是否有利润。第一方面要科学评估每个获客渠道,合理分配营销资源,提升获客效率,产品分析,在每个渠道上,为每个用户提供专属产品、权益和服务,让用户拥有完美的一致体验,促进用户持续转化。这一块主要是根据用户生命周期,有效开户数、用户活跃度,提升用户留存,提升营收和有效自传播。在内部沉淀出一套体系,每个环节有什么指标,遇到什么问题应该用什么办法解决,这已经是沉淀出来的模型。整体来说是包括三方面,渠道、获客和运营分析。
运营分析
闭环运营活动
整个过程中,或者是运营活动过程中,有4个环节,一定要把这环节形成闭环,其实是两方面,一方面是根据现有客户设立相应的和目标用户相匹配的金融产品,另一方面就是要根据现有的金融产品对目标用户进行分化。第一方面,现在主要是针对现有的目标用户,通过产品的组合,或者是匹配,我们要找到产品能和用户相匹配。做这个营销的过程之前,我们首先要想到,我们做预期的结果或者是效果,我们要建立分析体系,提前做好买点,其实就是数据的收集,一旦活动做完以后就能迅速看到活动的结果,整体就是形成闭环。总的来说,活动策划、活动实施、活动监测、活动复盘。
千人千面:运营落地
说到方法论,大数据在整个内部提供了一套行之有效的工具,包括BI体系支持上面一系列的运营落地,包括我们的产品、市场营销、产品运营、用户运营、监控,自助报表系统。还有统计分析平台,主要是做全产品线前端用户行为分析、产品流程漏斗分析,用户画像体系,提升个性化营销服务,最后是自助分析平台。主要是基础数据探查平台,满足运营、风控分析人员的查询功能。这个是用户画像,标签工厂具体的产品,功能模块分为微观画像、宏观画像、活动管理、效果评估、用户价值。
我大概说一下各个功能,主要是支持千人千面,把用户ID传到标签工厂里面,标签工厂会返回用户画像跟标签的信息,前端跟用户画像跟标签信息返回给这个用户展示怎样的产品跟页面,这是微观画像的功能;宏观画像主要是针对宏观的标签画像,帮助决策人员设计出适合目前用户的风控产品或者互联网产品,活动管理这一块是我们最核心的功能,通过标签工厂,在用户群添加活动。比如说针对某一个产品通过短信平台进行触达的话,在这里面通过标签筛选出用户,把这群用户从后台直接推给短信平台,在短信平台编辑短信直接发送,自动把我们所要营销的信息触达以后,最重要是最后的效果评估,后台已经做好了一系列的效果评估的数据回收、分析的体系,一旦这个活动开始以后,数据实时的收集,可以看到我们这次活动,比如用户触达的情况,或者转化的情况,以帮助后面运营人员策划市场营销策略。
产品运营:线上到线下的用户闭环
我说一下产品运营,在互联网金融里面,产品运营主要包括两部分,第一个就是互联网产品,第二个是金融产品。各个环节是否顺畅,转化率是否高,或者是哪一个环节跳出、流失特别高,这都是产品运营方面,或者是做用户增长需要重点关注的,其实就是功能优化、界面优化、流程优化,比如说理财产品,借贷产品,就说理财产品,期限怎样,额度怎样,这都需要研究项目,通过测试不断优化产品和挂标商业的时间。这是基于标签工厂做的一个事件规则的管理平台,举几个场景,比如说用户在我们的APP进行注册动作,注册成功以后,3天内可能浏览保险的页面,保险、基金、理财、借贷等产品,因为产品线比较多,比如说车险,我举个例子,可能7天没有动过,这是我们后台可以做到实时,给他发短信的活动,给他发代金券促使他完成交易;另一方面,浏览理财、基金、保险等页面,但他没有发生任何的交易行为,这时候我们可能认为他没有找到合适的理财产品,这时候自动给他推一个链接,然后会人工理财顾问就会借助平台,一方面极大的降低了目标清晰用户,因为有的平台对用户的干扰特别大,我们对于确实比较迷茫的用户,需要通过用户行为分析角度出发。针对国美金融的线下场景,这也是我们得天独厚的优势,因为国美是有1800多家门店,可以做理财的服务,或者是获客的服务,线下用户到店消费或者是存量用户,我们根据线下门店探查用户到店,然后基于云平台的数据,会反馈给门店的人员,哪一个人到店,然后他是什么样的特征,是否可以进行营销活动,从而形成线下到线上用户的闭环,这也是我们比较重要的一个场景。
互联网金融本质是金融:风控是不可避免的
上面主要是整个运营营销的话题,后边主要是针对风控,因为互联网金融本质是金融,谈到金融,风控是避免不了话题,因为风控的本质就是通过评估用户的还款意愿和还款能力。其实现在我的理解跟我们同业内的人聊天,大部分都是用量化风险控制的方法论,比如说用数据分析或者是数据挖掘等方法来预测用户的信用风险,并且通过用户的信用评分评估还款意愿或者还款能力,但是互联网金融的风控和传统金融行业的风控最大的不同是他们数据分析的关联不同,除了使用金融和金融场景高度相关的指标,比如说职业收入、年龄,包括学历指标,在网络上的行为数据,比如说用户在线下的行为,这个用户是否经常参与赌博、高利贷,对接数据的维度跟风险是很重要的指标。但是在之前,我们很难获取到用户的数据,获取用户数据的成本非常高,但是随着互联网发展,特别是移动互联网发展,用户在网上留下了他的痕迹,我们也有能力获取到他的数据,一个用户经常是在凌晨1点多发起的申请,我们认为这个人的风险比较高,也不一定,概率上风险是会比较高,比如说手机APP装的全是借款APP比较多,我们认为也会是风险比较高,加入大量的相关的指标,预测还款能力跟还款意愿。
这是针对刚才讲到的整个互联网风控或者一些方法论,其实整个大数据的基础架构包括几部分,第一个是数据获取,包括用户行为数据,就是通过SDK获取用户在APP上所有的行为数据;还有就是用户主动填写的基本信息,用户生存的数据,公开网站数据,爬虫能力;还有外部数据接入,里面包括黑名单的数据,把数据整合以后,就会进行风控模型计算,分为离线计算跟实时计算,再有一个是机器学习引擎;最后一个是图计算引擎,通过三大计算引擎计算完了以后,决策引擎会给出风险等级和评分,这是整个的技术架构。
结合技术架构、业务流程,大家更容易理解一点,主要是指2C端的业务,用户在前端APP进行申请,主要是几大类信息的收集,包括坚权类、个人基本信息、联系人、活体监测、人脸识别等、诉求。我们通过ID收集用户数据,包括行为数据跟位置数据、设备数据,这过程中,比如说运营商的数据,这些数据都是通过爬虫,这两个数据汇集到数据工厂以后,通过三大计算引擎还有红线,然后到了决策引擎,根据每一轮的引擎结果,根据每轮的决策结果由流程控制中心智能分配下轮需要数据源以及决策路径,最后是业务系统,核心、电审、贷后、帐务。整个流程过程中,我们计算流程过程中,基本风控维度在2千多以上,基本90%是在10秒搞定。
这里边重点说一下这个产品,这是知识图谱,应用场景,一个是手心,通过图计算技术扩展风控维度,提升风控能力;第二是反欺诈,通关多源数据的交叉验证进行不一致性检验,从而进行反欺诈或团伙反欺诈;第三是失联管理,为催收提供贷后逾期客户联系人信息。通过电话号码可以看到同事关系、邻居还是通过通讯录、亲戚等关系判断出来的,基本可以达到秒级的响应,这是国美金融整个大数据体系。因为我们现在也经过3、4年的沉淀,构建了整个风控体系和运营体系,包括大数据风控的计算引擎、决策引擎,包括运营营销、标签工厂都是经过一千多万用户,几百亿的量考验,所以说现在在做一个事,针对现有的技术做一些金融科技能力的输出,希望业内的同仁们有需要可以一起探讨这些事。