中诚信征信创新成果:万象智慧-AI反欺诈应用方案

专题库
来源:中国电子银行网 2018-09-19 13:28:00 2018中国金融科技创新榜中诚信 金融科技企业案例

核心提示“2018中国金融科技创新榜”科技企业参赛案例

  一、项目背景

  近年来,金融呈现互联网化趋势,越来越多的交易不在通过面对面形式达成,这也给一些不法分子可乘之机,网络上各类身份伪造、养号、骗贷、撞库、黑中介等欺诈行为层出不穷,且欺诈行为更加隐蔽和复杂。现有的大数据反欺诈体系主要依赖数据交叉核验以及专家经验进行,而与之关联的信息未能有效加入到评估环节,这也造成对单体信息不足以及团伙欺诈行为识别能力的缺失!

  金融机构为应对上述欺诈风险,逐步建立大数据反欺诈体系,通过数据交叉核验以及专家经验进行欺诈识别。在此过程中,金融机构的数据维度不断丰富,其中包含的交易、通讯、社交等复杂关系数据,受限于关系型数据库的查询性能,往往造成无法查询、查询效率低等难题,数据价值难以有效体现!与此同时,金融机构在面对高维及超高维的复杂关系数据时,传统建模往往受限于数据处理能力、计算能力,模型结果往往欠佳!因此如何解决复杂关系数据的关联挖掘及建模分析,进而有效识别互联化趋势下的欺诈行为,成为各金融机构在互联网化的进程中所面临的核心问题。

  二、项目成果简介

  万象智慧平台是中诚信征信基于大数据、知识图谱、机器学习等技术自主研发的AI反欺诈平台,平台实现了数据关联挖掘、欺诈学习、欺诈识别的自动化、智能化。在技术层面可大幅提升金融机构的数据处理及数据分析能力,其中基于万象智慧的模型自学习模式,反欺诈模型可随着业务数据流转不断优化迭代,同时不断优化自身反欺诈体系,使反欺诈体系具备自我学习、成长的能力;在业务应用层面,与当前反欺诈体系相比,补充了“关系”这一全新视角来审视风险,实现了反欺诈手段由点到面的提升,万象智慧可深度挖掘个体隐藏的关联欺诈风险,同时具备天然的团伙欺诈识别能力。

  万象智慧平台主要包含三个核心功能模块:

  1.关联挖掘:

  金融机构在经营过程中积累了大量的社交、交易、通讯类关系数据,这些数据结构复杂,数据量庞大,但传统IT技术难以有效进行关联挖掘,而其中隐藏的关联关系,可有效补充单体反欺诈、团伙反欺诈识别能力,因此如何挖掘并应用这些数据成为数据挖掘技术层面突破的方向。

  万象智慧基于知识图谱相关技术,对数据进行“降维”处理,通过“节点、边”的二元组进行数据诠释,通过图的表示学习(NRL)、社交网络分析(SNA)等方法,寻找并提取欺诈个人或欺诈团体的关系特征,部分特征可应用于反欺诈规则的制定,部分则作为关系特征进入机器学习系反欺诈建模环节。

  2.欺诈自学习:

  欺诈自学习主要依靠机器学习技术实现,作为后台计算模块,欺诈的自学习主要体现在对已有数据的业务经验总结,以及随业务开展,新样本补充后的模型自动迭代优化!与传统的反欺诈建模不同的是,万象智慧创新性地将复杂关系数据和图特征应用与反欺诈建模之中,复杂关系数据和图特征变量的补充可有效提升模型ks等指标,依据中诚信征信以往的项目经验,ks值在原有基础上提升8%~13%。

  3.欺诈识别:

  当前的反欺诈体系主要依据数据直观表现以及规则命中情况进行预判,万象智慧在此基础上,提供了“关系”的全新视角来审视风险,在关联欺诈风险识别角度,平台主要依据机器学习建模结果,结合标签传播算法、PageRank算法、社团发现算法等进行欺诈风险的关联挖掘,并进行页面的可视化展示!

  三、项目具体解决方案

  万象智慧是基于大数据、知识图谱、机器学习技术的AI反欺诈平台,在传统手段及数据基础上,补充了“关系”这一全新视角来审视风险,并以智能化手段进行欺诈的学习、识别。万象智慧平台通过对关系数据的深度挖掘,可有效解决单体信息不足的情况下反欺诈评估难题,同时万象智慧还具备天然的团伙欺诈甄别能力。

图1、方案架构图
图1、方案架构图

  关联挖掘:

  在处理多源异构的复杂关系数据时,万象智慧提供自定义“节点、关系、属性”的功能,平台自动化完成数据间的关联,底层主要以图数据库进行数据存储,有效解决了复杂关系数据在关联查询效率低与数据库维护成本高的难题。在中诚信以往项目经验中,常用的节点、关系、属性如下,节点可包括:身份证、手机、银行卡、申请地址、工作单位、单位地址、设备号等;关系包括:使用、拥有、居住、工作、同事、联系、人、亲属、通话、转账等;属性包括节点属性和关系属性:姓名、年龄、收入、性别、黑名单、逾期、拒贷、失信被执行、通话时长、通话频次、转账金额、转账频次等。

  万象智慧平台基于“输入数据-定义知识-输出关联”的应用理念,开发了知识管理、关联查询、动态关联、统计分析、族群监控、特征筛选等子功能,用户通过可视化界面自定义业务节点、关系、属性,平台自动完成关系创建及数据关联,在应用层支持单节点的遍历查询、实时数据的动态关联、数据关联统计分析、族群演化监控、指定特征节点及族群的筛选等服务,有效解决金融机构在面对复杂关系数据的处理、应用难题。

图2、关联挖掘-功能模块
图2、关联挖掘-功能模块

图3、关联挖掘-关联查询界面(信息脱敏)
图3、关联挖掘-关联查询界面(信息脱敏)

  在深度关联挖掘层面,万象智慧主要通过图的表示学习(NRL)、社交网络分析(SNA)、结合反欺诈标签的社交网络分析(SNA)三个方法进行关联欺诈的分析,通过上述方法实现了对节点的降维表示、关系网络中的凝聚性特征(个体网密度、凝聚系数、程度中心度)、关联性特征(离心率、关联中心度、介性中心度)等特征挖掘,以及欺诈网络特点的识别等,在此过程中产生的特征还以关系变量补充到机器学习的反欺诈建模中,可有效提高机器学习建模的准确性。

图4、万象智慧关系网络示例图
图4、万象智慧关系网络示例图

  欺诈自学习:

  传统的数据建模涉及开发工程师、数据挖掘工程师、算法工程师、运维工程师、业务专家等多角色多环节的紧密衔接与配合,整体流程耗时长,建模及维护成本过高。

图5、传统建模环节及角色
图5、传统建模环节及角色

  万象智慧平台的机器学习模块,主要包括变量分析、模型训练、模型预测、模型应用、模型监控以及Notebook六个子功能,平台对特征工程、模型训练、模型运维的流程实现程序化,对于特征工程、算法选择、参数调优实现智能化,用户可通过载入数据,设定业务目标进行智能化的模型训练与自学习迭代!

图6、欺诈自学习-应用逻辑
图6、欺诈自学习-应用逻辑

图7、欺诈自学习-模型报告界面
图7、欺诈自学习-模型报告界面

  在反欺诈应用领域,万象智慧平台依据知识图谱的复杂关系数据处理能力,创新性地将复杂关系数据和图特征数据应用与反欺诈建模与评估之中,其主要特点:

  -利用机器学习等方法解析数以亿计用户的数千维度信息;

  -基于自主研发的动态特征引擎,有效将复杂关系数据和图特征数据应用于反欺诈建模;

图8、机器学习建模
图8、机器学习建模

  欺诈识别

  当前的反欺诈体系主要依据数据直观表现以及规则命中情况进行预判,万象智慧在此基础上,提供了“关系”的全新视角来审视风险,在关联欺诈风险识别角度,平台主要依据机器学习建模结果,结合标签传播算法、PageRank算法、社团发现算法等进行欺诈风险的关联挖掘,并进行页面的可视化展示!

  -标签传播算法:基于节点相似性来判断风险的相似性,即用已知的 “坏”节点信息去预测未知节点的欺诈风险程度,用边来表示两个节点的相似度,节点的风险程度按照相似度传递给其他人节点,风险程度通过图的颜色进行可视化展示。

图9、风险传播示例图
图9、风险传播示例图

  -PageRank算法:PageRank是一种计算复杂关系网络中节点“重要性”的算法,一般以PageRank值进行表示,结合反欺诈业务背景,依据机器学习建模经验将复杂关系网络中每个节点的最终PageRank值进行高、中、低段分类,寻找高分段的可疑欺诈人群。

图10、PageRank算法分段图
图10、PageRank算法分段图

  -社团发现算法:主要基于GN、SLPA、Newman等社团发现算法对复杂关系网络中的可疑欺诈团伙进行聚类挖掘。分割后的每个社区中的节点相似度较高,通过寻找欺诈节点在分割后的社区中的分布,挖掘相似度较高的其他可疑欺诈人群。

  综上所述,万象智慧平台在反欺诈领域的关联挖掘、欺诈自学习、欺诈识别三方面提出了创新的解决方案,是结合大数据、知识图谱、机器学习技术的智能反欺诈系统,帮助金融机构具备从“关系”的角度识别风险的能力,可有效识别单体、团伙欺诈风险。

  四、核心价值

  在当前反欺诈体系中,主要依据数据与专家规则,在金融互联化趋势下,欺诈风险愈发隐蔽和复杂,如何有效防范防范互联化趋势下的欺诈行为是面临的核心问题

  万象智慧平台结合大数据、知识图谱、机器学习技术,可有效解决单体信息不足以及团伙欺诈识别难的痛点,帮助金融机构具备从“关系”的角度识别风险的能力。

  核心模块:

  关联挖掘:帮助金融机构深度挖掘关系数据的价值

  -通过图数据处理技术,有效解决金融机构处理多源异构的复杂关系数据的难题。

  -基于图的表示学习,实现对图数据的特征提取及分析,深度挖掘关系数据的业务价值,

  欺诈自学习:基于机器学习技术的自学习模式,智能优化反欺诈体系

  -万象智慧平台对特征工程、模型训练、结果输出的流程实现程序化,对于特征工程、算法选择、参数调优实现智能化,可大大提升金融机构的数据分析效率及能力

  -基于自学习模式,不断迭代优化欺诈模型,大大提升模型的效果,同时也降低模型的维护成本

  欺诈识别:补充“关系”这一全新视角来识别欺诈风险

  -基于“关系”这一全新视角,有效解决可有效解决单体信息不足的情况下反欺诈评估难题,同时万象智慧还具备天然的团伙欺诈甄别能力。

  五、项目收益

  自2018年3月产品发布以来,基于万象智慧平台在执行和洽谈的项目已有数十个。万象智慧平台可以完成对多源异构的复杂关系数据的关联挖掘,并对欺诈进行自学习,同时在当前反欺诈体系基础上,补充了“关系”这一全新视角来识别欺诈风险,帮助金融机构具备从“关系”的角度识别欺诈风险的能力。基于已完成的项目数据估算,中诚信征信可有效降低金融机构欺诈率5%~10%!

责任编辑:方杰

收藏

  • 最新
  • 最热

    点击加载

      点击加载

      我要评论
      普通评论
      游客

      登录后参与评论

      为你推荐

        暂无相关推荐
        财源源二维码

        热文排行

        • 今日热点
        • 每周排行
        合作媒体

        中国网络电视经济台 | 和讯银行 | 新浪理财 | 凤凰理财 | 腾讯网 | MSN理财 | 网易科技 | 中华财会网 | 第一财经网 | 北京商报网 | 和讯科技 | 财新网 | 中国网理财 | 金融界银行 | 光明网经济 | 东方财富网 | 经济观察网 | 中国经营网 | 赛迪网 | 新华信息化 | 中关村商城 | 同花顺金融服务网 | 环球网财经 | 投资时报 | 钛媒体 | 中国金融新闻网 | 新华网财经 | 人民网金融频道 | 中文互联网数据研究资讯中心 | 中金在线 | 外汇 | 品途网