TalkingData:信用卡行业数字化运营

专题库
来源:中国电子银行网 2018-09-21 10:32:56 2018中国金融科技创新榜TalkingData 金融科技企业案例

核心提示“2018中国金融科技创新榜”科技企业参赛案例

  一.应用场景

  通过对用户基础属性 、交易数据、App行为数据等千万级数据进行梳理、分析和机器学习模型的建立、结果总结,为信用卡App用户提供更方便的用户体验和更精准的产品推荐,最终实现数字化运营,推动业务提升,完成业务KPI。

  (1)业务应用场景分别为:

  非App用户转化为App用户,利用App进行数字化运营。

  移动用户活跃度的提升,提高精准营销转化率。

  通过行为数据分析,促进产品优化迭代,提升客户体验。

  通过机器学习建立预测模型,定位目标客群,促动账单分期及购买手机等消费分期。

  (2)效果:

  精准营销使响应率提升了5-10倍。

  建立促分期模型,App渠道分期占比提升120%。

TalkingData:信用卡行业数字化运营

  半年内注册用户量提升了1倍。

  提前实现了KPI设定的目标。

  二.技术手段:

  1. 利用TalkingData的移动运营平台,对行为数据进行采集和分析,并打通行内一方数据,构建完整的用户数据池及标签体系。

图-用户标签体系建设与应用的基本步骤
图-用户标签体系建设与应用的基本步骤

  2.依据业务需求,建立服务业务的金融场景标签。并参考客户特征和产品特点,利用决策树算法,建立精准客群,依据客群特征,设计营销方案,实现精细化营销。

  决策树分类算法是一种基于实例的归纳学习方法,它能从给定的无序训练样本中,提炼出树型的分类模型。决策树以实例(Instance)为核心,它从一组无序的、无特殊领域知识的数据集中提取出决策树表现形式的分类规则。它采用自顶向下的递归方式构造树状结构,在决策时分支节点进行基于属性值的分类选择,分支节点覆盖了可能的分类结果,最终分支节点连接了代表分类结果的叶子节点。分类过程中经过的连接节点代表了一条分类模式,而这些分类模式的集合就组成了决策树的框架。决策树分量算法有构造速度快、结构明显、分类精度高等优点。

  3.建立数据模型并多次对客群进行营销数据试验,依据营销结果迭代人群提取方法和营销方案,提高精准营销的转化率。同时采用机器学习思想lookalike以及GBDT,RF模型,利用现有种子用户,对其大量网络行为进行挖掘。

  lookalike的思想认为“物以类聚,人以群分”,用户行为间存在一定规律,相似的用户通常具有相似的偏好。基于此,我们运用GBDT和随机森林算法利用种子用户群随机进行负样本采样形成训练模型。

  GBDT(Gradient Boosting Decision Tree)是一种基于迭代所构造的决策树算法,这种算法在实际问题中生成多棵决策树,并累加所有树的结果得到最终答案。因此,GBDT的所有决策树都是回归树,而非分类树。首先我们用一个初始值来学习一棵决策树,叶子处可以得到预测值以及残差,之后的决策树就要基于先前决策树的残差来学习,直到预测值和真实值的残差为0.最后对于测试样本的预测值就是前面许多棵决策树的累加。

  随机森林实质是对决策树算法的一种改进,将多个决策树合并在一起,每棵树的建立依赖于一个独立抽取的样品。 单棵树的分类能力可能很小,但在随机产生大量的决策树后,一个测试样品可以通过每一棵树的分类结果经统计后选择最可能的分类。 每棵树对输入的数据要进行行、列的采样, 每一棵树的输入样本都不是全部的样本,每一棵树的特征也不是全部的特征。 由于之前的两个随机采样的过程保证了随机性,所以就算不剪枝,也不会出现过拟合。随机森林的优势在于,它是有监督的非线性模型,方便处理缺失值,容易进行并行化处理,通过行列采样可以尽量避免过拟合,并且运用Info Gain来进行分裂,特征层级较高,方便获取特征重要性。

  二.技术平台为:TalkingData移动运营平台,数据科学平台

  三.实施:

  采集信用卡App移动端的行为数据,进行标签化处理,同信用卡的交易数据和客户属性数据打通,提取特征值,依据业务场景和业务需求进行分析。

  利用App行为数据进行漏斗分析、诊断用户旅程,定位高漏损环节,进而指导产品优化迭代,提升转化率及用户体验。

TalkingData:信用卡行业数字化运营

  数据发现:进入注册页面的用户中,仅51%成功注册,其中步骤2漏损最严重,漏损率达32%。

  优化后,进入注册页面的用户中,有89%成功注册,注册转化率较原流程提升达38%。

TalkingData:信用卡行业数字化运营

  用户分群:通过数据分析,运用决策树方法,依据客户交易特征,积分特征,年龄特征,活跃情况、点击偏好等数据,进行用户分群,共划分35个客户群。

  以年龄分群为例:相对低年龄段的用户,App注册率高。26-30岁用户与40-50岁用户的侧重点不同,26-30侧重于消费,40-50侧重于积分。针对这两类客群,我们做了ab测试。结果如图。

图- 年龄分群树
图- 年龄分群树

  通过用户参加活动的行为数据,运用算法模型,预测用户对活动的敏感程度,对用户进行分群,比如折扣券敏感型用户、积分敏感性用户、消费返现敏感型用户等。首先需要推送的活动资源进行分类,分类如下:

TalkingData:信用卡行业数字化运营

  其次通过算法模型对千万级别用户进行预测打标。接下来我们根据预测值,进行相应推送,发现积分敏感度位于0.8至1.0的用户响应率达到5%,响应率在这一组别得到了明显的提高,我们将其归为高度敏感人群。

图-积分敏感度打分分类
图-积分敏感度打分分类

  依据客户群不同设计营销方案,进行精准营销。20个用户群转化率高于2%,其中3个客户群短信专利率高于5%。比非精准营销高出5到10倍。

  模型应用:以账单分期客户为种子,采用机器学习思想lookalike,在300万App用户中预测需要账单分期产品的客户。种子用户为近3个月在APP上有分期行为的30万用户,预测用户为近3个月没有过分期行为的大于300万的App用户 。我们利用Bootstrap多次随机采集负样本,样本正负样本比例较大(1:10),建立多个随机森林,根据AUC(正样本得分大于负样本的可能性)对预测分值做加权平均。最终对用户进行预测,筛选出TOP 20万客户进行营销。模型对200多个特征进行分析,筛选出20多个相关的特征变量。在引入行为数据标签的情况下,预测的准确度和转化率比之前的模型有50%的提升,预测效果有了较大的提升。

TalkingData:信用卡行业数字化运营

  四.方案前景

  通过数字化运营项目,未来成功经验逐步推广到整个卡中心。建立卡中心数字化运营体系,并形成固化的数字化运营方案,提升信用卡中心整体的数字化运营能力。数据指标体系覆盖日常运营、效果评估、产品迭代优化等各个环节,让数据驱动业务发展,并做到每个环节的结果都由数据来回答。

  经过多次数据试验,验证了行为数据对于精准营销,场景营销,事件营销,预测模型的效果,未来将重点应用行为数据来提升卡中心已有营销模型和风控模型的效果。

  数字营销领域,lookalike,GBDT,XGBoosting,RF等数学模型,经过多次调试,在海量不饱和数据的环境下,比传统的模型LR,SVM在分类和预测方面具有更高的效率,更优的结果。未来逐步在卡中心其他营销领域进行验证和推广。数字化运营体系的建立,将为卡中心各项业务的发展提供驱动力。

责任编辑:方杰

收藏

  • 最新
  • 最热

    点击加载

      点击加载

      我要评论
      普通评论
      游客

      登录后参与评论

      为你推荐

        暂无相关推荐
        财源源二维码

        热文排行

        • 今日热点
        • 每周排行
        合作媒体

        中国网络电视经济台 | 和讯银行 | 新浪理财 | 凤凰理财 | 腾讯网 | MSN理财 | 网易科技 | 中华财会网 | 第一财经网 | 北京商报网 | 和讯科技 | 财新网 | 中国网理财 | 金融界银行 | 光明网经济 | 东方财富网 | 经济观察网 | 中国经营网 | 赛迪网 | 新华信息化 | 中关村商城 | 同花顺金融服务网 | 环球网财经 | 投资时报 | 钛媒体 | 中国金融新闻网 | 新华网财经 | 人民网金融频道 | 中文互联网数据研究资讯中心 | 中金在线 | 外汇 | 品途网