目录

项目背景

分析思路

理解数据

数据预处理

数据分析(构建模型)

总结和建议

技术点


项目背景

分析思路

  1. 熟悉数据:导入数据、熟悉数据、分类变量。
  2. 数据清洗:统一变量名、缺失值处理、重复值和异常值处理
  3. 逾期用户画像:用户基本信息分析、用户行为信息分析
  4. 不良率分析:随记录时间变化趋势、与年龄性别的相关性、与初始评级的相关性、与借贷信息的相关性
  5. 总结与建议

理解数据

  • 还款情况:与还款相关变量
  • 基本属性:年龄、性别、学历
  • 行为属性:手机认证、视频认证、网页认证、浏览认证
  • 借贷信息:借贷金额、借贷期限、借贷利率等
  • 交易信息:客户发生交易行为数据。如:购物等

数据预处理

为属性重命名

统计变量的缺失情况,为缺失率做分析,

  • 下次计划还款利息、上次还款利息
  • 历史成功借款金额(当我们无法得知数据为什么缺失的时候,我们应该取问问业务部门)
  • 认证信息:户口认证、学历认证、淘宝认证、征信认证(只保留成功认证和未成功认证)

重复值的处理

在业务部门中确定很多东西

数据分析(构建模型)

  • 不同性别的放贷比率与逾期表现(那种性别放贷风险高)
  • 通过透视表pivot_table(data,columns,index,value,aggfunc=np.size)
    • 不同年龄放贷比率与逾期表现:各个年龄段借款金额的占比和cursum向前求和.分析得到36岁之前借款金额占百分之八十。年龄段在23到27岁借款已经占据百分之八十,55岁之后借款非常少
  • 各年龄段与贷款比数的情况:使用cut对年龄进行分段,按照不同年龄段统计贷款比数。
  • 年龄在25到30岁之间的借款在44.9%左右,逾期占比也是3.07%,逾期占比比较高的在55岁以上,24-30之间的用户贷款比较多,逾期比较少,可能是这个年龄段的人对贷款的需求比较高,收益也比较快
  • 学历认证成功与逾期的关系(不同的学历--是否认证--认证成功逾期占比与认证不成功逾期占比)
  • 淘宝认证:进行过淘宝认证的人群逾期会宽泛一点
  • 手机认证,视频认证,户口认证

总结和建议

总结

  • 男性借款指数是女性借款指数的近两倍,逾期男性用户也要高于女性用户
  • 学历认证和未认证人群比例1:1,相比之下进行过学历认证的人群逾期指数会低一点
  • 36岁一下的人口占比80%,25-30之间借款指数占比35%,平台主力军,可以为这些人做一些营销活动,吸引人群,增加用户量,55岁以上用户逾期占比比较高,这部分用户以后需要严格审核

建议

  • 年龄在55岁以上,学历比较低,未进行成功认证的人群以后要严加审核
  • 年龄在26-35之间的用户占整个用户比重的80%,逾期率也比较低,这部分客户我们应该想办法吸引
  • 平台不要认为认证成功的人群不是很可靠,对认证成功的用户也要严格审核

技术点

  • 最常用的就是pivot_table()和groupby()函数

【数据分析】互联网金融客户画像相关推荐

  1. 大数据应用---之---互联网金融---客户风险控制

    一. 前言 二. 大数据在互联网金融的应用 1 金融反欺诈与分析 2 构建更全面的信用评价体系 3 高频交易和算法交易 4 产品和服务的舆情分析 三. 客户风险控制 1 信用评分算法 2 分类模型的性 ...

  2. 互联网金融专业女生的优势适合女生吗

    互联网金融专业适合女生这一点是毋庸置疑的,学习互联网金融专业的学生在毕业之后可以在互联网金融公司.中小商业银行.融投资公司等金融机构,从事金融产品营销.互联网金融客户经理.网络理财师等相关工作. 专业 ...

  3. 互联网金融数据分析指标【汇总】

    互联网金融是指借助于互联网技术.移动通信技术实现资金融通.支付和信息中介等业务的新兴金融模式,既不同于商业银行间接融资,也不同于资本市场直接融资的融资模式.互联网金融包括三种基本的企业组织形式:网络小 ...

  4. 互联网金融数据分析体系

    互联网金融运营数据分析体系 一.指标分类 1.用户指标:包括用户信用评级.活跃度.留存率.转化率.客单价(平均投资额度).用户分布(各等级占比).互动指标等等. 2.产品指标:产品组合.投资人数.投资 ...

  5. 互联网金融项目数据分析

    一.项目介绍 数据来源:天池 数据内容:拍拍贷真实业务数据(拍拍平台借款端服务包括面向广大个人用户的通用性借款和其他借款.)从2015-01-01到2017-01-30的所有信用标的10%的样本. 项 ...

  6. 数据分析:互联网金融数据分析应用

    互联网金融在国内发展也才2年多的时间,从货币基金到P2P到众筹到股票基金,从传统ATM和手机银行短信银行,感慨这个互联网金融的到来,让我们有更多的信息渠道可以来了解金额. 还有像越女读财介绍的高暴利的 ...

  7. 数据分析在互联网金融的应用

    互联网金融在国内发展也才2年多的时间,从货币基金到P2P到众筹到股票基金,从传统ATM和手机银行短信银行,感慨这个互联网金融的到来,让我们有更多的信息渠道可以来了解金额. 还有像越女读财介绍的高暴利的 ...

  8. Oracle数据分析助力精准营销-客户画像 举例

    最近有个从事证券行业信息化管理工作的朋友找到笔者,提及最近监管政策收紧,各家证券公司都面临盈利空间告急,希望通过金融科技应用来实现转型,扭转不利局面.他本人经过反思,觉得还是应该回到金融服务本位,想从 ...

  9. 互联网金融数据分析应用

    转摘自:http://bbs.easysoo.cn/?p=476 互联网金融在国内发展也才2年多的时间,从货币基金到P2P到众筹到股票基金,从传统ATM和手机银行短信银行,感慨这个互联网金融的到来,让 ...

最新文章

  1. T-SQL: 17 个与日期时间相关的自定义函数(UDF),周日作为周的最后一天,均不受 @@DateFirst、语言版本影响...
  2. QT 建立信号和槽的联系(事件处理)
  3. 如何给mysql用户分配权限
  4. 谁说程序员干到 35 岁就不行了?
  5. Atlas, AJAX
  6. 两路虚拟化服务器,当四核多路服务器碰上虚拟化
  7. 信息学奥赛一本通 1848:【07NOIP提高组】字符串的展开 | OpenJudge NOI 1.7 35:字符串的展开 | 洛谷 P1098 [NOIP2007 提高组] 字符串的展开
  8. python兼容js base64_前端base64编码的坑
  9. 2017.5.6 子矩阵 思考记录
  10. SpringBoot(十四)_springboot使用内置定时任务Scheduled的使用(一)
  11. 算法的优缺点_朴素贝叶斯算法的优缺点
  12. SourceInsight初学使用笔记
  13. BZOJ2194: 快速傅立叶之二 (FFT)
  14. 第十三届第一场蓝桥杯嵌入式主观题讲解
  15. html5 css3 javascript从入门到精通,HTML5+CSS3+JavaScript从入门到精通(微课精编版)
  16. AI配音专家(文字转语音真人发声工具)官方中文版V1.0.5 | 文字转语音软件下载 | 这是一款阿里语音合成引擎且能把文字读出来的软件
  17. 如何做到秒级扩容1000加业务节点
  18. html怎么改变字段字体,怎么换字体?
  19. 支付宝app支付,订单参数错误/PHP生成支付宝预支付订单/php 支付宝app支付
  20. Linux运维高级核心基础

热门文章

  1. 符号表工具addr2line
  2. Kali Linux查看信息
  3. 申论公文题-方案类-1
  4. 卧槽,ChatGPT 太强了吧!
  5. Docker中ubuntu镜像安装ps显示进程
  6. 【题解】10-19秀秀的森林(forest)
  7. win10 ubuntu16.04 双系统 时间不一致问题解决办法
  8. 10个团建小游戏备选方案
  9. 南京市六合区原副区长焦晓英一行莅临云创
  10. Pr 如何模拟水下音效