兴业银行互联网大数据分析平台

项目意义

随着信用卡中心业务规模地不断扩大,以及相关产品和服务种类地迅速增加,卡中心自身的数据总量在剧烈膨胀、数据类型也在不断增多。与此同时,随着我国金融市场的逐步开放,以互联网为代表的现代信息科技,特别是,门户网站、社区论坛、微博、微信等新型传播方式的蓬勃发展,移动支付、搜索引擎和云计算的广泛应用,构建起了全新的虚拟客户信息体系,并将改变现代金融运营模式。数据海量化、多样化、快速化和价值化等特征,将给商业银行市场竞争带来全新的机遇与挑战,将改变其经营理念和服务方式。可预见,随着分布式计算相关技术的成熟、应用和发展,将为银行业务转型和产品创新创造了条件,银行业服务及管理模式都将发生根本性改变,未来的银行不仅应是数据大行,更应是数据分析、数据解读的优秀银行,要能够从数据中获得洞察力,从数据中攫取价值,从数据中赢得未来。

卡中心当前数据分析平台体系(包含基础平台、分析集市、分析仓库等)积累了丰富的数据,为信用卡各项业务发展提供稳定高效的数据支持。然而,随着大数据时代的到来,基础数据正向着大量、多样、高速、价值方向转化,传统数据处理技术已渐渐无法满足未来数据的变化及发展趋势,现有数据基础平台面临如下的困难及挑战:

(一)对于互联网半结构化、非结构化数据,无法有效存储、清洗和分析使用。随着银行业务的互联网化,产生大量非结构化数据,比如微信数据、信用卡APP数据等。此类数据若利用现有数据平台解析处理成本高、效率低,亟需一个大数据基础平台来采集处理此类异构数据,作为传统架构的补充及完善。

(二)客户行为数据无从采集,无法深入了解客户,挖掘其客户行为偏好。目前,卡中心缺乏获取客户互联网行为的渠道及平台,无法进一步深入了解客户的行为偏好,而此类客户行为数据恰恰却是卡中心深入了解客户最为缺乏的宝贵资源。因此,亟需一个大数据基础平台采集、整理客户行为数据,并利用大数据技术挖掘客户行为偏好,深入了解客户内心真正的需求。

(三)现有平台数据源已包含大部分业务数据,传统技术无法拓展新型数据源。随着大数据技术的发展,只有不断发现及引入新的数据源才是提升数据整体价值的关键,而随着新业务系统不断建设落地,亟需一个大数据基础平台进一步拓宽新型数据源,作为传统基础平台数据源的补充,通过传统及大数据相结合的方式拓展卡中心基础数据的广度及深度。

项目目标

搭建互联网渠道非结构化数据采集、处理、存储的大数据基础平台,本着“统一规划,分步实施,循序渐进,迭代上升”的理念,同时参考同业卡中心相关平台落地的实施步骤,本期项目以基础平台搭建为主,建立分布式处理框架,重点实现异构数据采集、处理和存储,并探索挖掘客户互联网行为标签。

业务功能

  • 搭建信用卡历史数据查询及互联网渠道数据分析应用系统,实现基于分布式技术的数据处理架构。
  • 搭建该平台的可视化管理平台,实现基于分布式计算技术的可视化的作业管理、作业监控、数据监控、平台监控、组件管理、配置管理、用户管理、权限管理、审计管理等。
  • 搭建该平台的交互式界面,提供通用、高效、友好的数据展现方式,实现展示(统计图表:饼图、折线、柱状)。
  • 实现各生产数据到分布式数据分析平台可视化的数据导入、清洗、转换、存储,并根据上层数据应用的需求,建立数据模型。
  • 实现基于微信、信用卡APP等非结构化数据处理场景,能统一接入并存储各类“新”数据,并提供合适的技术手段进行后续分析处理。
  • 根据采集处理后的互联网客户行为数据,充分利用分布式挖掘技术,初步实现客户行为标签等应用场景。