公告:执行院长刘勇出席互联网金融中国行天津站活动并致辞

正在加载中...

葛浩:百度金融的普惠之路——AI在信贷上的实践

时间:2018-06-28 16:51:00 来源:

  2018年6月28日,由中关村互联网金融研究院、中国互联网金融三十人论坛(CIF30)、国培机构联合主办的“第二届金融科技与金融安全峰会暨“番钛客2018”金融科技双创大赛启动仪式”在北京泰富酒店举行。本次论坛以“创新引领发展 科技驱动安全”为主题,逾600位金融科技、传统金融、投资机构等相关领导参与。百度金融首席架构师葛浩出席并发表了主题演讲。


  百度金融首席架构师葛浩提出AI技术发展为信贷服务提供了新机遇,智能核验、智能交互等新技术极大的延伸了人工、柜台的服务边界,带来底层账户体系和技术架构的变化,精准捕捉用户画像与需求,广泛用于获客、征信、反欺诈、交易安全等领域,提供底层硬件和运算能力的支持,使人工智能等技术的应用成为可能;同时,还提出用大数据和机器学习方法对当前有信贷意愿的用户进行精确定位,结合pre-A信用分对用户实时入白和预授信,建立广泛而精准的预授信机制。

以下为现场文字实录:

大家好,我是来自百度金融的首席架构师葛浩。很高兴和大家交流AI相关技术。并且用百度金融这一年多来的实践为杨帆先生的观点加油。

我今天演讲的主题是百度金融的普惠之路——AI在信贷上的实践。中国只有3亿人被央行征信覆盖,而有50%以上的小微企业是获得不了很好的金融服务,而中国人民70%以上的资产是贷款,而且他的收益率不足3%,中国家庭资产配置也非常不合理,金融资产的占比只有12%,而美国是能达到36%,这一系列数据说明金融在中国整个社会中的发展还在初级阶段。传统的服务方法无论在时间、空间和人群上都无法扩展到全体大众。刚好我们进入了一个新时代,就是AI时代。AI时代提供给我们很多的武器,其中之一就是人工智能技术。人工智能技术在智能的身份核验、智能交互上的突破,使我们极大的了延伸了受限于柜台的地域边界。其次是大数据,大数据给了我们对用户的信用和资质的一些新的评价手段。传统银行的工资流水确实也有效,但是他对这个人不了解,他这个人生活状况怎么样,家里有几个孩子都不是非常清楚,而互联网大数据能够精准的刻画用户画像,并在信贷反欺诈、交易安全方面发挥巨大的作用。第三就是区块链,区块链给我们带来了一种新的多方互信的解决方案,前面陈钟老师给大家做了一个很详尽的报告。最后就是更强大的计算能力的出现,使得人工智能能够得到很好的运行。这些是我们能够随时、随地、随需提供金融服务的技术基石。

基于此百度金融在信贷的各个环节中充分应用了AI的能力来优化我们的业务。首先是信贷获客方面,用户的身份信息和金融属性是传统银行和金融机构要熟知的信息。还有两类数据是关系数据和网络行为数据,这两类数据通常是在传统金融公司里不太重视的,这是移动互联网给我们带来的巨大机会,通过这些数据我们去构建用户模型,能够充分识别出来用户他是否会有资金需求,能够给用户一个很精准的投放,这种资金需求不仅仅是他正在寻找贷款,还包括全方位的描绘他的用钱需求。例如他现在正在装修房子,他的孩子在上培训课需要用钱,这就可以通过互联网大数据的识别出来,以便于提供优质贴身的服务,并规避风险。第二个有了需求以后我们就要对他进行智能身份核验,身份核验是把贷款公司开在云上最根本的要求,如果说来的人不能确认他的身份,那对于贷款是完全不安全的,所以百度在人脸识别上做了非常多的工作,在这方面业界排名上非常的高,验证准确率已经达到了99.77%,前一阵子我们和泰康人寿进行了一个合作,通过人脸识别使得他的整体流程从十天变成了两天,业务自动通过率提升了90%

第三个应用就是信贷的授信,一个人来了,这个人身份真实,接下来就是这个人信用到底如何,这方面除了传统的征信和金融数据之外,通过互联网的大数据也能进行信用进行评估。能够在用户来之前就对中国的用户预授信,指导获客针对信用良好的用户投放广告。现在百度对超过8亿人进行了信用评分,其中2亿用户进行了预授信.就是他还没有来我已经给他授予额度。通过这样的方法和技术使得用户来了之后能够达到秒级的授信。

第四用户在互联网上存在大量行为,这个行为除了说他搜了什么、看了什么之外,还隐藏了用户之间的社交关系,这样的社交关系网络,比金融交易的关联网络会更巨大和复杂,以百度金融的关联网络为例,有上百亿的节点,几百亿的边。进行一个秒级的查询是一件非常困难的事情,但真正做成这件事情做成之后,在黑产防范的工作中起到非常重要的作用,以上是2017年的进展。

业内通常认为百度不是一个适合做金融的公司,因为他掌握的很多数据都是非金融的数据。其他一些数据,比方说电商公司他掌握的银行帐号、交易记录,大家通常觉得这些信息是非常有价值,能够用来对用户进行信用评估的。假如风控官拿到百度的数据和相应互联网的数据会怎么去做呢?基于一些经验知识和人口属性的数据,通过特征工程来训练机器学习模型,或编写一些风险规则。这么做风控效果肯定不行。而百度在做什么样的东西呢?就是百度的“波若”大数据风控系统,这个大数据风控系统更多的是靠非金融数据。这些数据很大,从传统风控的眼里来看也不相关、分辨能力很弱、用来做模型没什么效果。确实,没有像广告和推荐系统那样几百上千万的用户行为来辅助训练,是无法利用好这种规模庞大的互联网数据来构建模型的。所以我们的深度学习系统之上有了一个相互学习的这么一个过程。不同的子模型之间,他们会进行相互学习共同成长。举个例子,一个用户来了,搜索数据构建的子模型能够进行推导出来说,他正在进行装修的,正在考虑装修方案的一个人,然后贴吧子模型因此也会跳出来说,对,他最近正在访问装修论坛。收到这样的信号,搜索子模型就会强化自己在识别“装修”需求上的效果。反之亦然。这样百度各种产品线用户行为数据,进行交叉印证、相互学习、迭代训练,能够使得我们整个深度神经网络变得非常之可靠,他能够自我学习和推理。然后在多个数据源、多个模型之间推选出最优的解。通过这样的方式,百度这些大家眼中很弱的数据,在模型中的重要性已经达到了和征信数据相同的水平。

另外一个例子,之前说AI更多是让计算机来感知和识别这个世界,例如人脸、物体、语音识别。现在一个新兴的方向就是智能交互式对话,和大家进行沟通。之前我们把这个技术除了用在客服上,现在新的应用场景就是用在催收上,催收的难题是什么?催收员每天打出很多个电话,对方也不是很友好,经年累月之下他也会有一些不爽的地方,偶尔会跟欠款客户发生言语上的冲突。机器人有什么好处呢?机器人没有自身的情感上的问题,可以做到打不还手骂不还口,把用户该知道的违约风险能够用一种很nice的方式告诉给他,如果他有什么问题,比方说不知道该如何还款,机器人都会来解答,只有那些经常性的欠款的用户,我们才分流到有经验的催收员身上,让他们来进行一些更针对性的沟通。这个机器人现在在百度已经开始在线应用了,而且相对于人工来说取得了不错的效果,不光是催收的回款效果更好,而且用户的投诉率也显著降低,这都是我们新的方法,在金融信贷领域上的一些新的应用,更多的信息可能再过几天百度的开发者大会上会有一个更全面的介绍,会向各位介绍百度所有在信贷风控方面的技术,也欢迎大家参加。

关于我们 联系我们

中关村互联网金融研究院
京ICP备14027115号  京公网安备 110108020153209 号
北京市海淀区丹棱街1号互联网金融中心
招聘