天云大数据分布式人工智能平台—Maxim AI

天云大数据复杂网络平台—Hilber

 

对银行信用卡申卡欺诈预警有效的大数据技术

解决了什么问题

传统的基于规则匹配的离散是欺诈分析预警系统已经无法适应庞大的数据系统,无法提供更为合适准确的判断方法。天云大数据提供的数据分析平台可以实现:

1、扩大了申卡欺诈数据源
目前的大数据反欺诈技术离不开文本挖掘,最重要的是语义识别。其次重要的是图像的挖掘,包括OCR识别图像文字、相似图片等等。传统申卡欺诈分析中往往运用强变量来评估个人在未来信用卡使用行为中的表现,没有整合分析其他维度的数据源。大数据申卡欺诈分析预警系统,首先,融合了信用卡申请环节的各个业务数据,解决了数据孤岛的问题;其次,引入第三方数据,比如银联数据等,扩展了数据的维度;最后,通过复杂网络技术,构建申卡客户的社交复杂网络提供客户的社交数据,在拓展覆盖维度的同时,以弱变量来体现强变量,并且实现了社交数据的高频率更新,提高了数据的准确有效性。
2、极大提高申卡欺诈预警准确率
传统的申卡欺诈分析预警技术需要大量的人工审核工作,必然掺杂了员工的主观因素,同时也提高了银行内外部联合诈骗的风险。基于大数据技术的申卡欺诈分析预警系统,大量减少了人工操作部分,同时提供了社交关系数据库,提高申卡欺诈预警的准确率。
3、 扩大了申卡欺诈分析模式
传统的申卡欺诈分析模式主要是基于规则匹配模型进行实现。随着经济的发展,市场的变化,科技的创新,欺诈方式不断更新积累,这倒是规则的数量不断增多到非常庞大的数量,维护和迭代更新的压力增大。基于大数据技术的申卡欺诈分析预警模式,主要是对大量数据进行挖掘,提供和清洗训练样本,针对亿级别的训练样本,提取扩展千万的特征,结合社交关系数据,利用大规模机器学习和深度学习平台进行模型训练。新型模式具有准召率高、预测效率高、善于发现新模型、从海量数据中总结规律、模型稳定、还有能力同时应对多个分类的优势。

使用了什么技术

天云大数据将某大型股份制商业银行北京地区信用卡申请客户的基础信息数据(总计超过30万)借助复杂神经网络BDCN,把申请人、申请人亲属、联系人及推广人这四种角色的移动电话、家庭电话、办公电话的相同作为关系,构建客户社交网络图,设计并计算出相关社交数据。

天云大数据将复杂网络得出的申请人社交数据,联合推广人信息数据、申请人信息数据、单位联系数据等引入神经网络模型,神经网络在真实的数据集环境中学习,通过不断地学习过程提高效率,交互式的调整其连接权重,通过不断增加学习过程,增强神经网络模型对真实数据集的环境的了解,当所有用于估计模型的训练集样本误差达到最小时,神经网络拟合完成,并且隐含的神经网络模型决定属性的分类规则。根据需求把新的申请信用卡客户属性转换为相应的数据代入模型,便可以得到客户是否数据欺诈属性以 及其所属类别。

天云大数据开发的大数据信用卡申卡欺诈预警系统主要包括申卡客户社交关系复杂网络的构建、基于神经网路模型的客户欺诈分析预警两部分。

应用领域 —— 风控及合规监管

客户 —— 光大银行