DataCanvas:数据科学平台

专题库
来源:中国电子银行网 2018-09-18 14:41:10 2018中国金融科技创新榜DataCanvas 金融科技企业案例

核心提示“2018中国金融科技创新榜”科技企业参赛案例

  一、案例摘要

  金融行业需要管控各种各样的风险,确保不能出现大的风险,对金融机构本身或整个行业造成大的冲击。其次在客户的存贷比例上,金融分析师需要严格把控,确保有稳定的利润差。再者,由于客户数量越来越多,多样性的需求难以一一满足。最后,面对海量的客户和交易数据利用传统的手段难以获得潜在的商业价值。

  针对以上痛点,DataCanvas提供了一款注重实战的分布式机器学习平台。除了丰富的分布式机器学习算法以外,还提供了用户生产环境需要的功能,以及丰富的数据预处理算子。尤其在深度学习领域,该产品是国内第一家具备模型生产化能力的数据科学平台,将模型实时用于生产环境,优化了分布式GPU调用,内置多种算法如:逻辑回归,决策树等常见的数据分析算法。该产品已经在金融行业应用了数年的时间,从中积累了大量的有用经验。用户可以借助其获得前所未有的商业洞察,助力其业务的快速发展。

  二、具体内容

  金融行业大背景:

  全球化使得国内外的金融机构都面临着激烈竞争,金融机构之间的相互影响也越来越明显,金融行业已然发生了重大变革。随着金融科技的广泛普及和发展成熟,智能数据应用已经成为行业热点趋势,金融分析师需要对业务有更深刻的运营和洞察,在对客户的分析和前瞻性方面要做到近乎完美。

  DataCanvas在银行业的应用案例-山东城商行联盟

  1、项目背景

  金融行业数据资源丰富,数据应用由来已久。从发展特点和趋势来看,大数据基础设施快速建设和落地奠定了金融大数据的应用基础,金融数据与其他跨领域数据的融合应用不断强化,人工智能正在成为金融大数据应用的新方向,金融行业数据的整合、共享和开放正在成为趋势。

  随着大数据技术的广泛普及和发展成熟,金融大数据应用已经成为行业热点趋势。在客户管理和精准营销的业务应用里,客户是银行赖以生存和发展的基础。大额存单和定期储蓄是提升核心竞争力、吸引优质客户、增加中间业务收入的主要渠道,也是培育客户忠诚度的重要手段,但是目前业务的营销方式粗放、目标客户不清晰、无法取得较好的营销成果。需要结合该城市商业银行的数据特点,快速提高大额存单和定期储蓄多个金融产品的营销成功率,完成金融产品智能推荐。

  2、需要解决的问题

  山东某城市商业银行通过建设一个低成本高效率的数据中心,能够存放历史数据并完成所有业务数据的快速查询,提供接入和整合外部数据资源,完成业务数据的挖掘分析。构建依托大数据技术的金融产品智能推荐分析平台,深入到业务和数据中对客户情况进行统计、分析和管理,寻找符合业务营销工作需要的目标客户,实现对客户的价值筛选和个性化分层营销,专业化、精细化提升客户体验的同时提升银行的收入。

  支持提供对大额存单和定期储蓄多个金融产品进行智能化营销,通过基于DataCanvas数据科学平台提供一站式解决方案,从数据的采集、数据的处理、数据的探索分析、数据的消费、数据的存储到数据服务的全生命周期覆盖。在该城市商业银行分析场景应用过程中,提供多个金融产品智能化推荐的解决方案。

  3、解决方案

  该金融产品智能推荐方案主要包括:通过对行方提供的数据的探索完成数据准备工作后,使用监督式机器学习算法辨别输入特征变量的重要性,并根据投票算法进行训练拟合,并对模型预测结果进行评估后,确定预测模型。该整体方案如下内容:

DataCanvas:数据科学平台

  使用数据工程平台DataCanvas DEP提供支持基础数据处理能力,实现数据的清洗、加载、转换、查询、计算和数据建模服务,并且内置多样化的数据清洗规则,支持多维度建模,管理企业数据血缘实现对该城市商业银行的高效数据管控。支持提供数据探索分析应用的宽表数据处理。

  使用机器学习平台DataCanvas APS提供全面的多源异构数据融合处理、可视化建模、自动机器学习、模型生产化、实时流处理、实时模型消费等多项数据存储、分析、计算服务能力,极大降低了客户进行数据价值挖掘的成本。

  DataCanvas APS支持提供统一的客户视图,内置多种算子(DataCanvas APS机器学习平台内置140+的算法模块, DataCanvas RT内置常用的统计模块),支持拖拽的方式生成工作流,极大地降低了数据分析平台的使用门槛,自动机器学习和调优功能让业务人员也能够以零代码方式轻松实现建模过程,企业级的模型生产化能力可以将模型以及中间的特征工程一起发布,极大提升了客户模型消费效率。

  DataCanvas兼容HDP,CDH,TDH等主流Hadoop环境,支持多种高吞吐量离线批量计算框架,支持毫秒级实时流计算、内存计算、GPU计算以加速计算过程。同时,提供实时数据分析功能, 解决企业用户实时性需求。支持提供随时可用的机器学习和预测分析库供业务用户灵活选择使用。

  DataCanvas APS进行数据模型过程如下所示:

DataCanvas:数据科学平台

  结合业务实际,运用关联检验与因子分析,识别客户聚类依赖。使用监督学习算法对输入特征变量和标签变量进行训练和拟合,并采用投票模型完成预测。投票模型将概念上不同的机器学习分类器结合起来,并使用多数投票或平均预测概率(软投票)来预测类标签。这样的分类器可以用于一组性能良好的模型,以便平衡其个体的弱点。在本方案中,对梯度提升算法、神经网络和贝叶斯三种算法进行等权重投票。

  以二十万元以上定存客户为例,高斯混合模型聚类算法自动选择将客户聚为六类,聚类不依赖于预先定义的类或带类标记的训练实例,需要由算法识别。聚类可以通过大数据建模技术将客户分层,提炼客群隐性特征,建立产品、服务智能推荐标准,帮助客户经理实践营销KYC策略。通过聚类模型对银行客群分类,将要预测客户的输入特征按照预测模型的变量重要性进行选择,同时,对选定的输入特征变量进行机器学习,并进行预测。

DataCanvas:数据科学平台

  该金融产品智能推荐方案面向银行“起存金额在20万元以上的大额存单客户和一年期定期存款客户”场景建模,以“数据+算法+大数据分析系统”为核心,可以向银行提供基于海量用户画像+实时大数据机器学习的个性化金融产品推荐服务。

  4、案例应用实践及效果

  该城商行联盟的金融产品智能推荐,本次分析整合用户画像系统以及源业务数据,共3678万多条客户记录,围绕客户330个维度,重点针对客户资产、客户历史交易,客户持有产品,客户关系圈,客户自然属性等多方面客户画像,形成宽表,构建面向部门级业务的数据集市,在识别客户千人千面基础上,完成目标客户细分和潜在客户发现。支持银行开展高效的客户挖掘应用,为金融产品的智能化管理和运营提供决策支持。

  该城市商业银行采用我司DataCanvas数据科学平台的金融产品智能推荐方案后,进行了试点。在试点中,营销780人,联系率32%,触达率68%,营销成功2650万元,拉新904万元。

  案例效果分析如下内容:

DataCanvas:数据科学平台

  1)通过DataCanvas大数据平台解决方案,实现了银行PB级数据的快速存储和横向扩容,同时满足了传统关系型数据无法处理的复杂数据分析需求。

  o2)支持流数据和批量数据导入至历史库。银行历史数据采用SQL查询,SQL查询性能单机数据扫描350MB/秒。

  o3)统一客户视图,基于机器学习的算法模块(平台提供140+算法模块)和可视化图表,对存量客户数据进行分析,自动构建用户画像并进行精准营销和消费预测分析。

  o4)结合实时、历史数据进行全局分析,风险管控部门可以每天评估客户行为,并对其信用卡额度等进行调整,使业务能力显著提升。

  o5、方案前景

  1)营销模式创新,实现了由数据支撑一线营销活动,通过数据分析用户需求,刻画客户全息视图,快速感知市场变化,提高了一线支撑响应和客户感知。

  2)服务效果提升,基于客户个性化特征的刻画,为客户提供更贴合的专业产品服务,提升服务质量。

  3)营销效果提升,通过营销预测名单,对产品进行“交叉营销”,极大推动了产品转化率。

  4)客户黏性提升,通过预测名单,对客户进行分类管理和服务,将沉睡客户转化为活跃客户,活跃客户转化为忠实客户。

  5)产品体系丰富,根据模型输出数据结合客户存款结构,设计了多款高端具有延续性的理财产品,吸引大量的新客户。

  6)技术能力提升,基于APS产品的数据科学建模流程,在解决客户实际的需求的基础之上,帮助企业现有技术人员建立数据科学工作流程体系和方法论,实现对企业技术团队的赋能,提升企业自身的技术实力。

责任编辑:方杰

收藏

  • 最新
  • 最热

    点击加载

      点击加载

      我要评论
      普通评论
      游客

      登录后参与评论

      为你推荐

        暂无相关推荐
        财源源二维码

        热文排行

        • 今日热点
        • 每周排行
        合作媒体

        中国网络电视经济台 | 和讯银行 | 新浪理财 | 凤凰理财 | 腾讯网 | MSN理财 | 网易科技 | 中华财会网 | 第一财经网 | 北京商报网 | 和讯科技 | 财新网 | 中国网理财 | 金融界银行 | 光明网经济 | 东方财富网 | 经济观察网 | 中国经营网 | 赛迪网 | 新华信息化 | 中关村商城 | 同花顺金融服务网 | 环球网财经 | 投资时报 | 钛媒体 | 中国金融新闻网 | 新华网财经 | 人民网金融频道 | 中文互联网数据研究资讯中心 | 中金在线 | 外汇 | 品途网