大数据要真正实现风险控制的作用,必须具备两项条件,一是数据够多,也就是样本量要充足;二是数据要有用,无效数据无意义。
互联网金融业务是基于征信背景的借贷业务,试想一下,当我们在审核一位借款人是否符合借款条件时,都需要考虑哪些依据?比较直接的应该包括这位借款人以往的借款记录(反映还款意愿与能力)、收入是否稳定(反映还款能力)、是否有其他方面的担保,比如房产的抵押、他人担保等等,而这些情况从目前来看,要通过大数据采集、分析尚有难度。除了央行征信报告以及一些平台推出的借款人“黑名单”外,有价值的信息参考还很少。而且很多平台虽然有大量的个人社交数据,但缺乏金融数据、交易数据,这都无法有效建立起自成一体的风控模式。
口袋理财虞凌云表示,假设互联网金融平台能够采集到一定基数的真实用户数据,将可以建立一定容量的数据库,以此为核心建立数据模型。首先,信用评分模型。平台可以通过评估用户的历史收入、资产、职业、年龄等信息,来估算出借款用户的信用风险分数,以此预测其违约风险。但这种模型的局限性在于历史数据的时效性及参考性十分有限,因而需要平台对用户数据变量进行定期监测及更新。第二,违约概率模型。与传统的人工经验预判概率相比,互联网金融平台可以通过积累用户的历史数据,从中提炼出借款用户的违约概率。
虞凌云还表示,除了征信建模以外,随着国内征信业务体系的日益重视及完善,互联网金融企业风险控制的手段将更加多样、更加严密,平台的风险估价能力还将进一步的提升。
|