银行离岸汇款客户交易预测

这是2018年招商银行最新的Fintech的复试习题,对于初学者而言,个人认为是一个不错的习题。
我在写这篇博客的时候,在这道数据分析题上已经战斗了5天,目前为止虽然得分不高,但是已经取得了阶段性的胜利。
在接下来几天里我回持续公布自己的思路,用到的方法。
希望与有志于数据分析的童鞋们切磋经验,欢迎留言交流!
## 赛题背景

离岸汇款作为境外汇款的重点,通过历史交易信息,提前预测客户未来的交易频度及资金安排,尤其涉及账户行(关联行)的资金头寸调拨,对银行中收及存贷产品销售具有重要指导意义。本次比赛为选手提供脱敏的交易流水数据,希望参赛选手通过分析数据并建模,解决85%的可能下,币种为美元 ( 32 USD ):
1. 未来3个月的汇出汇款(QRTA)与汇入汇款(ISIR)的平均日交易数;

2. 未来3个月的汇出汇款(QRTA)日平均交易额;
3. 结合汇入汇出交易及其他相关交易数据,预测3个月后联机余额排名前20的客户名单。

评价指标


该题目是让参赛者提交概率下的交易数据,由于交易数据是已知的,我们会根据参赛者提交的数据和真实实际的数据进行打分,该题目的打分是根据平均日交易数及交易额通过mae进行评判打分(日平均交易次数及日平均交易额 各占总分值30% ),TOP 20 用户根据预测结果排序与实际结果排序位移方差进行判定,如未能命中TOP 20客户,则记录超过20位移的值,与实际结果方差越小分数越高(占总分值 40%)。有关TOP20的评分法则,可参考TOP-N.py文件。

数据说明


以下为竞赛数据集用于提供训练数据及建模验证。其中:
1. train_dataset.txt 为16年12个月交易数据,以 \t 为分隔符,可用作模型建立的数据训练集使用。
2. 预测及计算结果以UTF-8无BOM编码的txt文件上传,包含以下信息,如下所示:
QRTA xxx

ISIR xxx

TOP20 xxxx
各标题与数据之间用 \t 为间隔符,
TOP20 中的各个客户编号,用 \t 分割开,具体格式如sample.txt所示。
计分规则:
参赛选手提交答案后会获得此次提交答案分数,计分规则是通过对已提交数据的偏差并根据偏差范围域进行评分的。
其中偏差计算逻辑为:
1. 问题1及问题2偏差规则。参赛选手通过提交日均交易数值x,与实际每天发生的交易数值相减后,除以天数n,得到偏差数值。偏差计算公式为
2. 问题3显示偏差信息为提交的TOP20结果排名与实际客户排名编号位置的标准差。实际计算python代码

偏差越小,分值越高,问题1、2各占30%,问题3占40%


特别提醒
1)数据使用:本赛题数据仅允许用于本次竞赛相关活动,禁止其他用途。
2)外部数据:本赛题仅允许使用“竞赛数据”中提供的数据,不允许使用任何外部数据。
3)数据提交:每日每位参赛选手最多通过系统提交5次的结果,重复提交或提交格式错误均扣除有效提交次数,请谨慎提交答案集。

train.txt

https://pan.baidu.com/s/16FGZaCWgwmDvV4eabTs7gA

sample.txt

https://pan.baidu.com/s/1g-vbG1lQ8psYxe0PvuXfPg

银行离岸汇款客户交易预测相关推荐

  1. ML之RF:利用Pipeline(客户年龄/职业/婚姻/教育/违约/余额/住房等)预测客户是否购买该银行的产品二分类(预测、推理)

    ML之RF:利用Pipeline(客户年龄/职业/婚姻/教育/违约/余额/住房等)预测客户是否购买该银行的产品二分类(预测.推理) 目录 利用Pipeline(客户年龄/职业/婚姻/教育/违约/余额/ ...

  2. 银行用户流失分析与预测

    一.项目背景与目的 数据来源于Kaggle某项目:Bank Customer Churn | Kaggle 本数据集包括10000条匿名跨国银行的客户数据.数据分析的目的是预测客户流失的概率,然后通过 ...

  3. kaggle-Santander 客户交易预测总结

    1 绘图 sns.kdeplot()--核密度估计图 sns.distplot()--集合了matplotlib的hist()与核函数估计kdeplot的功能 Seaborn入门系列之kdeplot和 ...

  4. 第四部分 个人理财风险防范8.当心银行汇款引发的诈骗

    近年来,银行个人电子汇款以其省时.省力.费用低的优势日渐受到广大居民的欢迎,特别是2003年9月1日个人结算账户的推出,更为银行个人汇款业务提供了良好的发展空间.但是,因银行汇款和邮政汇款的要求不同, ...

  5. 客户传真第四部分 个人理财风险防范8.当心银行汇款引发的诈骗

    发一下牢骚和主题无关: 近年来,银行个人电子汇款以其省时.省力.费用低的优势日渐受到宽大住民的欢迎,特别是2003年9月1日个人结算账户的推出,更为银行个人汇款业务提供了良好的开展空间.但是,因银行汇 ...

  6. 机器学习实战案例:使用随机森林/XGBoost等模型进行分类预测,提高银行营销活动效率

    1. 项目背景介绍 在这篇文章中,我们将使用 Python 搭建逻辑回归(Logistic Regression),随机森林(Random Forest),XGBoost,Bagging,KNN (K ...

  7. 银行大数据应用案例(研讨会整理)

    本文为银行大数据研讨会.探讨以银行客户为切入点,大数据在金融行业的应用.大致内容整理: 一. 业务驱动 银行应用大数据,主要是由其业务驱动.应用大数据的业务驱动主要由精准营销.风险控制.改善经营和服务 ...

  8. 大数据在金融行业的应用——银行大数据

    精准大数据之银行客户案例 智树科技于上上周五与精准数源大数据部门就银行大数据为主题,开展了网络研讨会.探讨以银行客户为切入点,大数据在金融行业的应用.大致内容整理: 一.   业务驱动 银行应用大数据 ...

  9. 2022-2028年中国离岸金融行业市场全景调查及投资潜力研究报告

    报告类型:产业研究 报告格式:电子版.纸介版 出品单位:智研咨询-产业信息网 离岸金融(Offshore Finance)是指设在某国境内但与该国金融制度无甚联系,且不受该国金融法规管制的金融机构所进 ...

最新文章

  1. linux telnet远程登录工具,Linux 远程登录(telnet ssh)
  2. mac 远程桌面提示: 证书或相关链无效
  3. CEikEdWin 类的使用
  4. 《研磨设计模式》chap4 适配器模式Adapter
  5. 关于html文档,关于HTML的简介
  6. 【计算机组成原理】加减法器
  7. 【转】第01课:生活中的监听模式——一坑爹的热水器
  8. [Winodows Phone 7控件详解]容器控件
  9. spring boot controller 增加指定前缀的两种方法
  10. “融合、智能、绿色”施耐德电气线上工博以全生命周期解决方案助推数字化
  11. fiddler修改支付金额_不容忽视的记账工具:支付宝记账
  12. 设计模式之美:Strategy(策略) -未经作者同意的转载
  13. 计算机学情分析,中职学生的学情分析 《计算机专业》.doc
  14. 【Flink】解决 No ExecutorFactory found to execute the application
  15. compizconfignbsp;nbsp;中的方框…
  16. django 给单个文件加log_django配置日志模块
  17. jQuery 判断是否包含某个属性
  18. 北京-波士顿-西雅图时间对照表
  19. docker设置不同网络和迁移到指定网络
  20. 腾讯云Centos8.0 CPU使用率100%,top查询为kthreaddk占用异常

热门文章

  1. 如何创建全球(全局)公司代码 (Global Company Code )
  2. vector不是模板 list不是模板
  3. 一篇文章带你搞懂慢SQL以及优化的策略
  4. go-colly入门+案例
  5. Oracle中同义词synonym的作用
  6. Django计算机毕业设计校园二手拍卖网python(源码程序+lw+远程部署)
  7. QT开发环境的建立以及QTE4.6.3、tslib1.4的移植过程
  8. 爬虫中常用的加密逻辑(python实现)
  9. 能通过一张照片(2D)得到3D的模型吗?
  10. Pr安装的Speedx插件后,在视频素材上添加这个插件效果后,出现网格解决办法?