小夏:最近买的医疗行业基金老跌=-=

小南:我中秋节前买了白酒哎,最近涨了好多,就知道节假日白酒依旧会涨。

小木:是嘛,你是怎么知道什么时机合适买入的,好的基金怎么选呀

小南:我的理财平台上给我择时推荐的,之前还给我推了好几支不错的基金呢

近几年,基金市场火热,相关话题频上微博热搜,相信基金选购话题也经常出现在大家的聊天话题里。基金相对股票来说低风险,且交易频次易控制,已成为新手理财或稳健理财的头号选择,我们作为购买者,会比较基金的短期、长期收益率、单位净值、基金经理的经验等来选择投资。同时,基金公司也会建设客户画像,为每个购买者推荐基金,在此之间,数据作为桥梁打通购买者的需求与售卖者的营销策略,互惠互利。

今天我们来看下基金行业的客户画像是如何搭建的。

一、基金行业的标签建设需求    

金融科技的快速发展,使得资管行业的载体与社交媒体、电子商务融合越来越紧密,企业需要借助数据战略打破数据边界,来构建更为全面的企业营销全景视图。以袋鼠云数栈产品和某基金客户在智能标签上的合作为例。

对基金客户来讲,随着各项业务迅猛的发展和客户数量的急速增长,公司对客户、产品、渠道、反洗钱等方面的数据分析、统计、运营提出了更高的要求。但客户主要面临以下2点问题:

(1) 客户等数据分散于各个系统,无统一的分析平台;

(2) 各类数据分析和提取大多采用半自动的工作模式,无科学的标签体系及资源共享平台提供及时和有力的支持,导致客户信息维度不完整,客户活动开发周期长,运营不精准,营销效果缺乏及时追踪、运行反馈不及时等。

鉴于以上痛点,及更好的适应并支持现实业务的需要,建立客户自己的标签系统。

具体建设目标   

  • 建立涉及客户、产品、渠道的三层标签体系,支持销售、服务、合规等不同角度的需求;

  • 支持便捷的标签开发、运算、展示和输出等全生命周期管理,持续输出数据价值;

  • 支持客户个体及群组画像、客户群圈选和对比,支持快速推广、智能营销、精准服务;

  • 细粒度的标签权限管理和高效稳定的标签展示和输出,确保安全且高效的业务开展;

  • 积木式的组件标签搭建和复用,可快速支持例行、临时或专题性的数据分析。

二、基金行业标签建设方案    

1. 建设方式

智能标签标准产品(DataTag)+标签体系梳理与开发

2. 技术方案

标签建设一般会包含“数据读取-标签加工-标签更新-标签评估-标签圈群-客户/群组画像-群组分析-数据服务”,其间涉及到技术选型如下:

  • 数据存储:采用Hive进行数据存储;

  • 分析引擎:Presto

  • 标签计算与查询:Presto读写Hive;

  • 标签/群组对外服务:API查询HBase;

  • 数据同步插件:袋鼠云自研批流一体数据同步插件FlinkX;

以下是标签建设通用方案与该项目具体方案:

标签建设通用方案

某项目技术架构

a.计算集群对接:智能标签产品采用的OLAP引擎是Presto,并有Presto的二次开发能力,如Presto的公开插件中没有Inceptor的连接器,袋鼠云便自研该插件完成Presto对Inceptor的读写,进行标签的加工与查询。DataTag之前也已适配过Cloudera的CDP产品,支持对接Apache Hadoop集群以及发行版Hadoop。

b.标签周期与手动跑批:

(1) 采用presto读写Hive数据进行标签大宽表的加工,最终将所有标签放在一张大宽表中,从而提高标签圈群与群组分析的效率;

(2) 标签除根据选择的调度周期定时跑批外,可进行手动更新,且手动更新时产生一个新的秒级分区,以解决业务人员想即加工标签即用的场景,不影响其他人员圈群的需求。

c.标签圈群:通过Presto查询标签大宽表进行目前群组圈选,并让用户选择群组数据是否要落库和定时更新。

d.数据服务:标签和群组的对外服务,通过数据同步或数据API来完成。

(1)通过数据同步工具,将存在Hive的标签表、群组表同步至其他数据库,在其他应用平台应用。

(2)创建API服务,通过API接口调用标签或群组数据。会将Hive的结果表同步至HBase,API查询HBase数据库,具有查询速度快、存储数据量大、可解决Presto并发量不高问题等优点。

3. 产品方案

对应以上建设目标,产品解决方案如下:

a.多实体与关系建模

基于“多实体”设计,实现可创建基金行业中客户、产品、渠道多个对象的标签体系;并可通过“关系”将多实体进行关联,创建基于多个实体原子标签的衍生与组合标签。

b.[原子标签/规则标签/SQL标签/算法标签/组合标签]多维标签生成

可将数仓ETL加工的原子标签直接读入。用DataTag中设置规则标签与SQL标签的加工规则,“求和、去 重计数、计数、最大值、最小值、均值、排序”等聚合函数、子查询、连接操作符、多层且或关系均可支持,灵活加工出目标标签。同时通过算法平台加工算法标签,并将算法标签的元数据读入DataTag进行标签统一管理,实现标签的便捷加工与运算。

标签加工方式灵活多样,业务人员也可直接介入规则类标签标签加工,可随时修改标签规则。且标签创建完成后,可立即进行标签更新,让业务人员立即使用,提高生产效率。

c.标签全生命周期管理

从标签定义-标签开发-标签发布-标签更新-标签评估-标签下线,管理标签全生命周 期,各过程可管可控,统一标签管理规范、沉淀企业核心标签资产,形成企业统一的标签中心。

d.个体画像、群组画像、群组对比、群组显著性分析等优化标签体系与群组投放

(1)个体画像:根据实体用户标识,查询单个实例的实体画像,如某用户的用户画像,帮助运营人员 更加直观的了解用户,助力精准营销。

(2)群组画像:自定义画像模板,从不同维度分析群组特征,掌握群组画像,为目标群组 的选择与营销策略的投放提供参考。

(3)显著性分析:通过 TGI 指数计算群组的显著性特征,挖掘群组偏好,提升增长、 赋能业务。

(4)群组对比:同一实体下的不同群组进行相似性与差异性分析,查看群组特征,进行群组优化。

e.数据权限细粒度精致,保障数据安全

(1) 标签可见性控制:通过标签发布时控制可见用户组,实现部分标签只对部分人员可见,形成部门或个人的标签池。

(2) 标签读写列权限控制:发布某标签(后续进行标签加工),使用某标签(标签圈群和分析时使用)都需要经过部门管理员、项目管理员审批,严格控制标签的查询、加工操作。

(3) 标签行级权限控制:针对用户设置标签的可读行级权限,比如负责直销售基金的部门,只能查看渠道是“纯直营自销“客户的标签数据,不可见“代销“渠道的客户数据。

(4) 标签脱敏:针对敏感标签(如身份证号、电话号码等)可进行部分人员脱敏,数据查询或分析时,展示脱敏后的数据。

通过标准化的产品方案,解决客户无统一标签分析平台、标签半自动化加工、加工周期长等痛点。

4. 标签体系设计

按照标签建设方法论和数仓模型,从基金客户的基本属性数据、交易数据、持仓数据、基金产品数据、用户行为数据等多方面数据,建设出基于以下标签类目的200+标签,每天定时跑批加工。

基于以下划分标准,采用不同的标签类型,在不用平台完成标签加工。

  • 原子标签:既定事实,从原始数据中提取,比如性别、生日等信息;

  • 衍生标签:没有对应数据,需要定义规则,由原子标签来计算得出标签实例,比如区间类;

  • 组合标签:没有对应数据,需要定义规则,多种类型标签来计算得出标签,比如偏好类;

  • 算法标签:参考已有事实数据建立算法模型,来预测用户的行为或偏好;

  • 实时标签:基于业务系统数据实时更新标签数据,比如基于埋点数据设计的标签;

  • 自定义标签:通过自定义sql的形式完成标签数据萃取;或手动打给用户的标签。

三、标签在基金行业的应用场景    

基于建设好的标签,业务人员便可透明化的使用标签,将数据库的黑盒子变成业务语言的白盒子,辅助业务决策,驱动业务增长。标签在基金行业主要应用于以下场景:

新基金推广

当新基发行时,会进行一定的营销活动,向用户推广。如新基金首先会面向直销自营、偏爱新基金、活跃客户、不具有反洗钱特征等的用户推送,先圈定一部分用户,然后再结合客户的交付风格、持仓风格圈定优选客群。推送一批客户后,可再基于首轮命中客群的相似人群进行补充推广,是一个持续迭代的营销过程。

互联网营销

面向个人的基金推荐,如债券型基金一般推送给有过购买债券型基金行为、购买潜力高的客户;根据用户偏好进行千人千面的金融资讯推送,丰富用户理财知识;基于用户的投资时长,推送不同理财阶段的投资课程等。

异常交易监控

根据用户风险类标签,找到短期内频繁开立账户、撤销账户、频繁交易、交易IP跨境、交易时间异常的客户,进行重点防范与预警,保障金融安全。

用户流失预警

根据客户活跃度、交易周期、账户余额区间、盈利情况等标签,找到静默用户,进行触点激活。

后续数栈智能标签产品将会采用算法进行人群圈选,补充业务规则圈群的局限性,以及基于实时标签人群的实时推送方面进行进一步探索,使业务营销更加精准、高效。

-End-

数栈是云原生—站式数据中台PaaS,我们在github和gitee上有一个有趣的开源项目:FlinkX,FlinkX是一个基于Flink的批流统一的数据同步工具,既可以采集静态的数据,也可以采集实时变化的数据,是全域、异构、批流一体的数据同步引擎。大家喜欢的话请给我们点个star!star!star!

github开源项目:https://github.com/DTStack/flinkx

gitee开源项目:https://gitee.com/dtstack_dev_0/flinkx

数智洞见 | 你买基金了吗?聊聊标签画像在基金行业的应用相关推荐

  1. 可信数智云,联通云的个性化标签

    关注云报 洞察深一度 联通云.联通云.联通云, 重要的事情说三遍! 以中国联通发布新定位.新战略为契机,一朵独一无二的"可信数智云"正式亮相,这便是中国联通全新升级的云服务品牌-- ...

  2. AIGC浪潮来袭,奇点云“数智科技大会”洞见AI加速的数智未来

    "进化,发生在每一个数字化场景." 5月25日,以"数据进化论"为主题,由StartDT(奇点云.GrowingIO)主办的2023 StartDT Day数智 ...

  3. 宝利德余海军浙商封面 :新数智时代的修行者

    很少有一种发明如汽车一般改变人类的生活,转动的车轮不仅仅意味着人类可触达距离的延伸,也代表着更为广阔的天地.而对宝利德控股集团(以下简称宝利德)董事长余海军而言,再没有一种产品如汽车般改变他的人生. ...

  4. 《你好,数智新世界》系列访谈 对话数睿数据总裁刘超|企业级无代码赋能软件产业变革...

    最近无代码在业界刮起了一股旋风,一家名叫数睿数据的公司,推出了一个数用一体化的独具特色的企业级无代码软件平台--Smartdata,短短4个月时间就获得了包括红杉中国在内的多家机构的两起高额投资. 早 ...

  5. 共赴数智金融未来,2023数智金融峰会即将召开

    当前,数智化转型浪潮席卷全球,我国金融科技正从"立柱架梁"全面迈入"积厚成势"新阶段,新技术.新业态正不断拓宽数字金融的边界,金融数字化转型趋势不可逆转.2月2 ...

  6. 打通企业的“韧”督二脉,戴尔科技赋能数智远见者

    关注云报 洞察深一度 有一个成语"宁折不弯",本指在受到外力作用时,不会弯曲变形,只会折断,现多用来比喻宁死不屈的抗争精神.今天,在面对不断增加的市场和经济的不确定性,以及持续的疫 ...

  7. 专访科特勒咨询集团王赛:以“数智融合”做桥梁,让企业数字化转型”天堑“变通途...

    "[报告下载]后台回复关键词"数据智能"可免费下载数据猿最新发布的完整高清版<2021中国数据智能产业发展报告> 大数据产业创新服务媒体 --聚焦数据 · 改 ...

  8. 收藏!490家专精特新数智企业全名单:听听“小巨人”企业怎么说?

    2011 年 7 月,工信部<中国产业发展和产业政策报告(2011)> 提出:"十二五"时期,我国将推动兼并重组与促进中小企业健康发展并举.促进中小企业健康发展的下一步 ...

  9. 2021中国企业数智服务十大趋势

    明天,2020年11月19日.国内企业服务领域趋势洞察的年度专业高端峰会--"洞见2021 中国企业服务年会"将在北京香格里拉饭店隆重举行.本次大议以"双循环时代的数智新 ...

最新文章

  1. 台式机BIOS被加密后密码忘记解决办法
  2. python matplotlib画折线图_python使用matplotlib绘制折线图教程
  3. git上的分支命名规范
  4. 动态规划简单应用:斐波那契数列
  5. js如何实现扫描身份证识别_如何识别身份证上信息?快速录入看这招
  6. ECharts 雷达图在类目值下面显示数值
  7. [luoguP1013] 进制位(搜索)
  8. mysql事务的acid、三种并发问题与四种隔离级别
  9. 做arma模型步骤_互助问答第349期:关于ARMA预测模型的问题
  10. -bash: ifconfig: 未找到命令
  11. 【Linux】gcc + gdb 安装教程
  12. Luogu2619[国家集训队2] Tree I
  13. openwrt中各种默认配置文件所在目录
  14. Qt6.0开发环境搭建
  15. 用于单图像超分辨率的增强深度残差网络
  16. 中科院计算机学院考研2021,2021中国科学院大学研究生分数线一览表(含2019-2020历年复试分数线)...
  17. 拼多多商品详情页 API接口、拼多多商品SKU数据接口 API接口、拼多多关键词搜索接口 API接口 API接口、拼多多关键词采集 API接口、拼多多采集接口 API接口、拼多多详情 API接口
  18. 群发邮件平台有哪些?哪个好用?
  19. 游戏轮播图片-制作煽动翅膀的效果(含素材视频教程)
  20. 联想小新Air15 2021新款11代酷睿版win10+Ubuntu16.04双系统装机笔记

热门文章

  1. Excel -- 批量删除字符大于某值的单元格
  2. mysql创建数据库名字中带 - 的方式
  3. WIN10系统让服务程序自启动
  4. [原创] 神的计划8 - 创世纪–约瑟
  5. ROS暑期学校暨人工智能与机器人视频回放和分享信息(2022)
  6. 有趣的自定义View — 小米MIUI10相机·滑动功能指示器
  7. 什么是面向对象? 谈谈你对面向对象的理解
  8. win10删除的文件怎么恢复
  9. 计算机主机为什么漏电,主机箱漏电原因是什么 电脑机箱漏电的最好解决方法...
  10. 2021-2027全球与中国单质肥料市场现状及未来发展趋势