关于企业贷款违约情况的数据分析研究

import pandas as pd
import numpy as np
import matplotlib.pyplot as mp
data = pd.read_csv('data.csv',encoding='gbk') # 加载数据
data # 显示全部数据

查看字段

data.columns
Index(['Unnamed: 0', '进项总额', '销项总额', '盈亏额', '进项退款率', '销项退款率', '平均退款率', '进货单量','销售单量', '进项退款数', '销项退款数', '销售净利率', '营业成本率', 'Unnamed: 13', '销进货数比','是否违约', '违约率'],dtype='object')

字段描述

data.info()<class 'pandas.core.frame.DataFrame'>
RangeIndex: 123 entries, 0 to 122
Data columns (total 17 columns):
Unnamed: 0     123 non-null int64
进项总额           123 non-null int64
销项总额           123 non-null int64
盈亏额            123 non-null int64
进项退款率          123 non-null float64
销项退款率          123 non-null float64
平均退款率          123 non-null float64
进货单量           123 non-null int64
销售单量           123 non-null int64
进项退款数          123 non-null int64
销项退款数          123 non-null int64
销售净利率          123 non-null float64
营业成本率          123 non-null float64
Unnamed: 13    0 non-null float64
销进货数比          123 non-null float64
是否违约           123 non-null int64
违约率            123 non-null float64
dtypes: float64(8), int64(9)
memory usage: 16.4 KB
  1. 从描述性统计可知,违约的概率总的来说是比较小的。
  2. 而且企业平均的销售总额达到了1.29亿元左右,绝大部分企业是比较大型的企业。
  3. 企业的平均退款率大概只有0.083左右,不足百分之一,说明多数企业产品比较合格。

使得图表中能显示中文

from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['Simhei']
mpl.rcParams['axes.unicode_minus'] = False

获救情况人数可视化

data.是否违约.value_counts().plot(kind='bar') # 柱状图
mp.title('企业贷款违约情况(1为违约)')
mp.ylabel("企业数")
mp.legend()
mp.show()

绘制饼状图

data.是否违约.value_counts().plot.pie(figsize=(4,4))
mp.title("违约情况(1表示违约)")
mp.legend()
mp.show()

说明大部分企业的违约概率都集中在0.2左右,和实际违约情况基本相符

密度图

data.盈亏额[data.是否违约 == 1].plot(kind='kde')
data.盈亏额[data.是否违约 == 0].plot(kind='kde')mp.xlabel("盈亏额")
mp.ylabel("密度")
mp.title("盈亏额和是否违约关系")
mp.legend(("违约","不违约"))
mp.show()

违约企业比不违约企业盈亏额的绝对值更加靠近0,但是亏损和盈利基本分布均匀,所以是否亏损和是和否违约关系不明显,但是相对来说,盈亏绝对值更大的更不容易违约。

违约和不违约企业营业额分布散点图

mp.scatter(data.是否违约,data.销项总额)
mp.ylabel("销项总额")
mp.xlabel("是否违约")
mp.title("按照销项总额看是否违约分布可视化(1为违约)")
mp.show()

违约企业中没有营业额超过一亿元的企业,说明小型企业抗风险能力差,更容易违约

密度图

data.平均退款率[data.是否违约 == 1].plot(kind='kde')
data.平均退款率[data.是否违约 == 0].plot(kind='kde')mp.xlabel("平均退款率")
mp.ylabel("密度")
mp.title("平均退款率和是否违约关系")
mp.legend(("违约","不违约"))
mp.show()

图中可知,绝大部分企业平均退款率在0-0.1之间,但是在大于0.1以后,明显企业更加可能出现违约情况,应该警惕平均退款率大于0.1的企业

密度图

data.营业成本率[data.是否违约 == 1].plot(kind='kde')
data.营业成本率[data.是否违约 == 0].plot(kind='kde')mp.xlabel("营业成本率")
mp.ylabel("密度")
mp.title("营业成本率和是否违约关系")
mp.legend(("违约","不违约"))
mp.show()

对于营业成本率特别高的企业应该尤其关注,提高其风险等级

a=data.销进货数比
b=data.违约率
mp.xlabel("违约率")
mp.ylabel("销进货数比")
mp.title("销进货数比和违约率关系")
mp.plot(b,a)

销进货数比高的企业一般不容易违约,反之则需要格外关注

密度图

data.销售净利率[data.是否违约 == 1].plot(kind='kde')
data.销售净利率[data.是否违约 == 0].plot(kind='kde')mp.xlabel("销售净利率")
mp.ylabel("密度")
mp.title("销售净利率和是否违约关系")
mp.legend(("违约","不违约"))
mp.show()

销售净利率和是否违约关系不明显

总结

  1. 本样本理论违约率和实际违约情况基本吻合,说明原来银行预测理论基本准确
  2. 企业的净利润率和是否违约关系不明显
    3.企业盈亏额和企业违约情况关系研究
    3.1 企业盈亏额是否盈利和违约情况相关性不明显
    3.2 盈亏绝对值越小的企业相对违约率更小,反之更大
  3. 企业销售额与企业违约情况关系研究
    4.1 超过一亿元的大企业比小企业更少违约
    4.2 大企业的抗风险能力比小企业更好,资金腾挪空间更大
  4. 企业平均退款率与企业违约情况关系研究
    5.1 平均退款率在0-0.1区间的企业违约情况更少
    5.2 产品平均退款率在0.1是分界线,银行对于此类企业贷款应该更加慎重
  5. 企业营业成本率超过2左右的企业应该格外关注,违约概率更高
  6. 销进货数比高的企业一般不容易违约,反之则需要格外关注

关于企业贷款违约情况的数据分析研究的Python数据分析案例相关推荐

  1. 数据挖掘实践(金融风控-贷款违约预测)(二):数据分析

    数据挖掘实践(金融风控-贷款违约预测)(二):数据分析 目录 数据挖掘实践(金融风控-贷款违约预测)(二):数据分析 1.引言 2.基本知识点 2.1缺失值(Missing data) 2.1.1缺失 ...

  2. python数据分析要学什么_python数据分析学什么?python数据分析入门

    有很多没有基础的新手想学习python数据分析,却在纠结python数据分析难不难学?下面万古网校小编给大家整理了资料,为各位分享! 1.python难不难? Python可以说是目前比较主流而且易学 ...

  3. python 数据分析学什么-python数据分析学什么?python数据分析入门

    有很多没有基础的新手想学习python数据分析,却在纠结python数据分析难不难学?下面万古网校小编给大家整理了资料,为各位分享! 1.python难不难? Python可以说是目前比较主流而且易学 ...

  4. 【数据分析入门】python数据分析全过程梳理与代码实现

    文章目录 数据分析 数据获取 探索分析与可视化 预处理理论 分析建模 评估模型 数据分析 数据获取 [数据分析入门]python数据分析之数据获取方法 探索分析与可视化 [数据分析入门]python数 ...

  5. python数据分析可视化实例-Python数据分析与可视化从入门到精通

    (1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果.(2)专注于Python数据分析与可视化操作中实际用到的技术.相比大而全的书籍资料,本书能让读者尽快上手,开始项目 ...

  6. 数据分析系列之Python数据分析简介

    Python是一门简单易学且功能强大的编程语言,使其在许多领域成为编写脚本或开发应用程序理想语言 .Python被称作"胶水语言",是由于其运行效率的问题,将程序核心部分由C++等 ...

  7. 从零开始学python数据分析-从零开始学Python数据分析与挖掘 PDF 扫描版

    给大家带来的一篇关于数据挖掘相关的电子书资源,介绍了关于Python.数据分析.数据挖掘方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小67.8 MB,刘顺祥编写,目前豆瓣.亚马逊.当当 ...

  8. python 数据分析学什么-python数据分析哪些课程好?

    目前数据分析.机器学习的应用如火如荼,许多同学都有意参与到这股学习的热潮中来,但是令人苦恼的是,学习资料有很多,但是常常感觉无从下手. 这是因为,这里所涉及到的数据科学是一个综合学科,想掌握他需要熟练 ...

  9. 从零开始学python数据分析-从零开始学Python数据分析与挖掘 PDF 下载

    资料目录: 目 录第1章 数据分析与挖掘概述 11.1 什么是数据分析和挖掘 11.2 数据分析与挖掘的应用领域 21.2.1 电商领域--发现破坏规则的"害群之马" 21.2.2 ...

最新文章

  1. 获取预制和获取gameObject
  2. android FloatingActionButton
  3. 利用Python进行数据分析-07-汇总和计算描述统计
  4. android-async-http 源码分析
  5. Linux du查看磁盘文件夹占用容量
  6. 顶尖机器学习学习路线,6个月让你的技术成为行业TOP5%
  7. python 之头像上传,预览
  8. 软件工程项目____搜查令
  9. 日久见人心,以小见大
  10. android studio 2.2 preview 3,Android Studio 2.2 Preview 3 发布,优化图片支持
  11. Oracle ERP Interface堵住--Request Running too long time,查找Request执行的Sql
  12. HTML第五章课后作业,第五章 组合逻辑电路 课后习题答案详解 资料资料资料.pdf...
  13. C盘爆满原来是腾讯电脑管家惹的祸
  14. worldpress php7.2,centos7.4下word press环境由php5.6.4升级到php7.2
  15. Unity 编辑器下运行没有声音
  16. 王立柱《c语言》3.5.4
  17. MyEclipse使用教程——使用DevStyle Icon Designer(二)
  18. 怎么剪切音频的一部分 去掉音频中的某段内容
  19. PCIe driver
  20. Echarts柱状图柱子点击事件

热门文章

  1. Http管理状态:Cooki与Session
  2. 校园市场开打:电信抢先、移动联通滞后
  3. 【喜报】华为OD统一考试(B卷)题库清单(已收录161题),更快,更全的 B 卷题库大纲
  4. Android下手机截屏
  5. Java Tomcat 以及Eclipse显示三只小猫咪图标
  6. rundeck用户权限管理
  7. 菜鸟—需求预测与分仓规划季军——“我们为R代言”团队赛后总结
  8. 后羿:我射箭了快上—用MotionLayout实现王者荣耀团战
  9. 物联网IoT协议之OPC UA快速入门教程
  10. Value '' can not be represented as java.sql.Timestamp