金融反欺诈分析

通过机器对各类数据的采集和分析,利用机器学习及复杂网络等创新的模型算法技术,识别欺诈者身份,大幅提升银行欺诈风险的防控能力。

借端欺诈是一个主要的银行风险来源,也是银行反欺诈的重点聚焦领域,但对传统银行来说,往往采用的是一些传统的反欺诈手段,无论在效率、有效性、全面性以及成本上都是银行的短板,尤其随着互联网金融的兴起,非现场交易的增多,更是加剧了银行的风险防控的难度。

本方案从银行反欺诈的脆弱点着手,通过机器收集了大量异构、多样化的信息,包括可交叉验证信息主体所提供的信息以及第三方信息来源的真实性,通过对数据的采集和分析,再通过机器学习及复杂网络等创新的模型算法技术,对数据进行深度挖掘,发现欺诈者的隐藏的蛛丝马迹,分析其数据的矛盾点和可疑点,从而识别欺诈者身份,加上与传统经验规则配合使用,大幅提升银行欺诈风险的防控能力。

  • 数据来源:欺诈分析所使用的数据主要来源内部数据和外部数据,针对不同的数据源,本方案通过多种采集方式对数据进行有效采集,并集中在数据湖中进行融合存储。
  • 数据预处理:根据预测模型分析的需求,通过配套的数据处理技术工具对数据进行预处理,输出模型训练所需的样本数据。
  • 模型训练:使用配套的模型算法训练平台(MaximAI)基于样本数据进行一站式的模型算法训练、验证以及输出。
  • 实时分析:训练完成的模型算法程序,被输出到欺诈分析引擎中,运行于大数据平台技术上,实现了实时在线对交易数据进行欺诈识别。
  • 采用国际主流的Hadoop生态体系技术,技术先进、成熟,且底层大数据平台采用的是BDP企业版,实现友好、灵活、便捷、开放的Hadoop技术管理。
  • MaximAI的算法平台的引入,相比于传统SAS,能够更有效的结合Hadoop、Spark大数据分布式技术,实现全量数据的分析处理,全套可视化的模型训练,为用户提供算法由开发到生产服务一站式的管理方案。
  • 率先采用基于标签索引和关联图谱的数据探查技术,便于对多源异构数据源的数据治理,加快数据由原始到算法模型变量的快速就绪。
  • 数据湖的体系框架引入,为未来系统在技术上和业务上的可扩展性铺垫了坚实架构基础。
  • 方案以及方案所采用的技术产品在众多大型金融项目上成功实施,方案技术成熟可靠。
  • 技术:发挥大数据技术能力,分布式架构支撑大规模分析计算能力,从而支撑全量数据数据挖掘分析。
  • 分析:引进机器学习、复杂网络等先进分析技术,深度挖掘数据,配合传统的专家经验规则,提升欺诈风险的识别能力。
  • 成本:充分发挥人工智能的自动化能力,实现机器代替人进行不同个体的分析评估,从而节省人力资源的投入成本。
  • 准确:收集并融合多渠道数据,从而消除信息屏障、增加数据维度,提升分析的精准度。