近日,中国证监会北京监管局、北京市地方金融监督管理局公布了首批纳入资本市场金融科技创新试点项目。试点名录项目普遍运用了新一代信息技术手段,覆盖了客户服务、业务辅助、合规科技、监管科技、信息技术基础设施等各个领域,着眼于解决长期制约证券期货行业发展的痛点难点问题。天云数据的“基于人工智能的单账户配资异常交易监测系统”从众多申报项目中脱颖而出、位列三甲,成为“证监会版”监管沙盒项目之一。

场外配资的严峻形势行业痛点如何拔除

 

挑战一:人工智能是一次表达能力的升级

 

原来伞型配资在同一个实体账户上同时有多个配资者进行交易,非常容易抽象的刻画行为。但到了单账户配资阶段同一个实体账户上同时只有一个配资者进行交易,大量实体账户被使用,隐蔽性越来越强,如何快速捕捉交易风格的快速切换?

深度学习通过组合底层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布特征表示。与人工规则构成的方法相比,利用大数据来学习特征,更能够客户数据丰富的内在信息。

 

挑战二:隐私计算可以实现在数据不动的前提下完成数据价值流动

 

交易数据和用户身份数据属于券商的隐私数据,在充分竞争的市场环境之内,交易双方是不会交换核心资产的。那么如何在数据不互通的前提下完成数据价值流动,实现科技监管?

 

挑战三:云原生可以实现全市场要素的联动

 

科技监管又如何借助云原生来形成一个全市场要素的联动,从交易所到头部券商和中小券商,能否协同形成市场对异常交易行为的闭环治理?

 

人工智能厂商是隐私计算的最大驱动者

互联网没有普及之前,我们是通过应用系统生产数据。这一波信息浪潮是以信息化为中心,面向应用和流程。数据作为副产品被自然排放出来,所以核心技术是以数据安全为主导,例如数据安全技术、防火墙、堡垒机等。

 

互联网普及之后,我们是通过人的行为生产数据,每天浏览各种网站链接都在生成数据,包括日志文件、XML文档、JSON文档、Email等。各个应用的运营者、消费者和执行者,跨在不同的产业的位置上。个体的数据所有权的使用权和访问权开始分置和剥离,这迫使隐私计算开始成为主要的技术。

在数据驱动业务替代流程驱动业务的时候,隐私计算作为对数据安全技术的覆盖,它更强调的是在“数据不出门,可用不可见”的情况下,最大化利用行业跨机构数据价值,充分发挥数据价值。
隐私计算提供的是数据价值流动一个枢纽的技术环节,它是面向数据消费。传统的数据消费者是决策者是领导,数据消费需要做管理驾驶舱、仪表盘、报表、大屏等显性的表达方式,领导根据这些数据分析结果进行宏观决策。而到了行为生产数据,像打车软件动态规划算法、电子商务网站上的以概率统计的算法,比如推荐引擎、贝叶斯网络,由先验决定后验数据的方法,这些算法代替了可视化技术。所以面向新一代的数据消费,人工智能厂商是隐私计算的最大驱动者。

AI+隐私计算改变异常交易智查系统痛点

 

传统异常交易智查系统检测存在成本高、效率低、更新慢等问题,难以实现多样复杂的筛选规则。传统检测时人工根据分析和经验建立一系列筛选条件,针对异常交易账户进行手工排查。存在以下几个主要问题:
以手工为主,存在成本高、效率低、更新慢等缺点。

筛选规则由监管人员主观决定,缺乏客观依据。

异常交易账户行为模式不断发生变化,筛选规则难以及时做出调整。

筛选规则有限,难以实现多样复杂的筛选规则。
如何加强配资活动的监测力度,通过技术手段在合规范围内实现数据交换和价值流动,天云数据展开“单账户配资异常交易监测系统”探索实践工作。在原有具备伞形配资识别能力的智查系统之上,结合人工智能创新,开发具备单账户配资识别能力的新系统。

 

新一代异常交易智查系统智能检测方,利用信息化、系统化,大数据,人工智能等技术归集原本零散的知识经验,进行系统运行。确保处理效率,并做到处理情况可审计、可检验。

 

联邦学习

保障数据安全跨机构利用行业数据

通过联邦学习构建一个隐私保护机器学习系统,使得拥有数据的多方能够联合训练一个或多个模型,并且任意一方的数据不会泄露给其他参与者。

AI建模

深度学习建模高效识别单账户配资行为模式

首创、原创的采用深度学习孪生神经网络模型,建模识别、监测账户的使用一致性,找出潜在配资行为。该系统将深度学习技术应用到该场景当中,具备对数据的自适应性能,能够高效识别异常交易。采用联邦学习技术,实现“数据不出门,可用不可见”,在保障数据安全情况下,最大化利用行业跨机构数据价值,充分发挥行业云的行业价值。

(孪生神经网络算法原理示意图)

云原生

云端SaaS服务轻量级部署安全保障

通过行业云SaaS服务和联邦学习技术,监测系统从点到面、横纵结合。通过联邦学习技术将券商各自提供的特征数据进行融合并优化配资分析模型,同时行业券商也可以接受新技术不断优化带来的高效分析服务。打破券商之间的数据壁垒和风控孤岛现状,降低了高风控能力的技术门槛,快速有效提升全行业风控合规能力,将风控合规能力输出给全行业。
天云数据在国内一流大型综合类券商智查系统的技术创新实践:应用神经网络技术:在定性成果上,完成风险监测操作指引、风险控制指标动态监控系统管理指引、异常交易行为管理指引。在定量成果上,通过对该券商200多万资金账户进行判定,发现高度疑似配资账户170个。

天云数据建设数据资产平台打造数字化产业明星级数件产品


通过行业云SaaS服务和联邦学习技术,监测系统从点到面、横纵结合。通过联邦学习技术将券商各自提供的特征数据进行融合并优化配资分析模型,同时行业券商也可以接受新技术不断优化带来的高效分析服务。打破券商之间的数据壁垒和风控孤岛现状,降低了高风控能力的技术门槛,快速有效提升全行业风控合规能力,将风控合规能力输出给全行业。


天云数据在国内一流大型综合类券商智查系统的技术创新实践:应用神经网络技术:在定性成果上,完成风险监测操作指引、风险控制指标动态监控系统管理指引、异常交易行为管理指引。在定量成果上,通过对该券商200多万资金账户进行判定,发现高度疑似配资账户170个。

天云数据数据资产平台建设分三层结构:贴源层、标注层和知识层。贴源层:核心梳理优势数据资产,面向重点行业数据建立无损数据湖;标注层:面向人工智能的样本库和标注平台建设;知识层: 提供数据资产计算封装和发布服务,打造标杆数件产品。这核心有四个关键内容,领域知识包ES、常识知识knowledge Graph、元数据网络Metadata和AI特征库FE。

01领域知识包
借助低代码决策引擎专家系统,快速沉淀能源交通军事等专业领域知识包,借助容器k8S封装/发布/订阅专业知识包。

02常识网络
基于知识本体建立复杂网络,借助知识图谱推理服务建立已有知识推理的常识库。

03元数据网络
面向IT多元异构数据融合,自动采集登记IT信息系统数据产品。类似互联网DNS解析网络地址,但没有解析信息资产本身。DNS对应工商系统的组织机构编码,元数据网络对应描述工商企业经营信息。元数据网络可以跨越数据标准快速融合和上架数据资产。

04特征库
面向AI模型的特征工程库,沉淀领域数据衍生知识描述。

数据资产平台不同于数据湖、大数据资源等信息存储类型数据中心建设,而是存算一体的数据资产建设,面向数据产品登记上市定价流通的技术支撑营运平台。数据资源的抽象封装和使用,不同于大数据采集、加工处理、分析的传统数据处理流程,数据消费端不仅是报表管理驾驶舱等数据可视化,而是面向人工智能算法训练,构建新一代数件产品的DaaS基础设施。

天云数据建设全球领先的数据资产平台,发布对前沿科技发展创新有关键价值的数据产品,面向产业和行业提供数据资源服务的发布推理订阅,打造数字化产业领域内明星级数件产品(Dataware)。

首批金融科技创新试点,天云数据隐私计算出现在资本市场名录,说明天云数据的全行业布局和联动推广得到了市场权威机构的肯定。在行业头部券商主导的全行业动作里,天云数据能在51个行业优质项目之中脱颖而出,印证了天云数据行业规模化落地的能力。

未来,天云数据会深耕新一代信息技术,积极探索大数据和人工智能等新型技术手段,为数智产业发展提供安全技术保障。