关于企业贷款违约情况的数据分析研究的Python数据分析案例
关于企业贷款违约情况的数据分析研究
import pandas as pd
import numpy as np
import matplotlib.pyplot as mp
data = pd.read_csv('data.csv',encoding='gbk') # 加载数据
data # 显示全部数据
查看字段
data.columns
Index(['Unnamed: 0', '进项总额', '销项总额', '盈亏额', '进项退款率', '销项退款率', '平均退款率', '进货单量','销售单量', '进项退款数', '销项退款数', '销售净利率', '营业成本率', 'Unnamed: 13', '销进货数比','是否违约', '违约率'],dtype='object')
字段描述
data.info()<class 'pandas.core.frame.DataFrame'>
RangeIndex: 123 entries, 0 to 122
Data columns (total 17 columns):
Unnamed: 0 123 non-null int64
进项总额 123 non-null int64
销项总额 123 non-null int64
盈亏额 123 non-null int64
进项退款率 123 non-null float64
销项退款率 123 non-null float64
平均退款率 123 non-null float64
进货单量 123 non-null int64
销售单量 123 non-null int64
进项退款数 123 non-null int64
销项退款数 123 non-null int64
销售净利率 123 non-null float64
营业成本率 123 non-null float64
Unnamed: 13 0 non-null float64
销进货数比 123 non-null float64
是否违约 123 non-null int64
违约率 123 non-null float64
dtypes: float64(8), int64(9)
memory usage: 16.4 KB
- 从描述性统计可知,违约的概率总的来说是比较小的。
- 而且企业平均的销售总额达到了1.29亿元左右,绝大部分企业是比较大型的企业。
- 企业的平均退款率大概只有0.083左右,不足百分之一,说明多数企业产品比较合格。
使得图表中能显示中文
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['Simhei']
mpl.rcParams['axes.unicode_minus'] = False
获救情况人数可视化
data.是否违约.value_counts().plot(kind='bar') # 柱状图
mp.title('企业贷款违约情况(1为违约)')
mp.ylabel("企业数")
mp.legend()
mp.show()
绘制饼状图
data.是否违约.value_counts().plot.pie(figsize=(4,4))
mp.title("违约情况(1表示违约)")
mp.legend()
mp.show()
说明大部分企业的违约概率都集中在0.2左右,和实际违约情况基本相符
密度图
data.盈亏额[data.是否违约 == 1].plot(kind='kde')
data.盈亏额[data.是否违约 == 0].plot(kind='kde')mp.xlabel("盈亏额")
mp.ylabel("密度")
mp.title("盈亏额和是否违约关系")
mp.legend(("违约","不违约"))
mp.show()
违约企业比不违约企业盈亏额的绝对值更加靠近0,但是亏损和盈利基本分布均匀,所以是否亏损和是和否违约关系不明显,但是相对来说,盈亏绝对值更大的更不容易违约。
违约和不违约企业营业额分布散点图
mp.scatter(data.是否违约,data.销项总额)
mp.ylabel("销项总额")
mp.xlabel("是否违约")
mp.title("按照销项总额看是否违约分布可视化(1为违约)")
mp.show()
违约企业中没有营业额超过一亿元的企业,说明小型企业抗风险能力差,更容易违约
密度图
data.平均退款率[data.是否违约 == 1].plot(kind='kde')
data.平均退款率[data.是否违约 == 0].plot(kind='kde')mp.xlabel("平均退款率")
mp.ylabel("密度")
mp.title("平均退款率和是否违约关系")
mp.legend(("违约","不违约"))
mp.show()
图中可知,绝大部分企业平均退款率在0-0.1之间,但是在大于0.1以后,明显企业更加可能出现违约情况,应该警惕平均退款率大于0.1的企业
密度图
data.营业成本率[data.是否违约 == 1].plot(kind='kde')
data.营业成本率[data.是否违约 == 0].plot(kind='kde')mp.xlabel("营业成本率")
mp.ylabel("密度")
mp.title("营业成本率和是否违约关系")
mp.legend(("违约","不违约"))
mp.show()
对于营业成本率特别高的企业应该尤其关注,提高其风险等级
a=data.销进货数比
b=data.违约率
mp.xlabel("违约率")
mp.ylabel("销进货数比")
mp.title("销进货数比和违约率关系")
mp.plot(b,a)
销进货数比高的企业一般不容易违约,反之则需要格外关注
密度图
data.销售净利率[data.是否违约 == 1].plot(kind='kde')
data.销售净利率[data.是否违约 == 0].plot(kind='kde')mp.xlabel("销售净利率")
mp.ylabel("密度")
mp.title("销售净利率和是否违约关系")
mp.legend(("违约","不违约"))
mp.show()
销售净利率和是否违约关系不明显
总结
- 本样本理论违约率和实际违约情况基本吻合,说明原来银行预测理论基本准确
- 企业的净利润率和是否违约关系不明显
3.企业盈亏额和企业违约情况关系研究
3.1 企业盈亏额是否盈利和违约情况相关性不明显
3.2 盈亏绝对值越小的企业相对违约率更小,反之更大 - 企业销售额与企业违约情况关系研究
4.1 超过一亿元的大企业比小企业更少违约
4.2 大企业的抗风险能力比小企业更好,资金腾挪空间更大 - 企业平均退款率与企业违约情况关系研究
5.1 平均退款率在0-0.1区间的企业违约情况更少
5.2 产品平均退款率在0.1是分界线,银行对于此类企业贷款应该更加慎重 - 企业营业成本率超过2左右的企业应该格外关注,违约概率更高
- 销进货数比高的企业一般不容易违约,反之则需要格外关注
关于企业贷款违约情况的数据分析研究的Python数据分析案例相关推荐
- 数据挖掘实践(金融风控-贷款违约预测)(二):数据分析
数据挖掘实践(金融风控-贷款违约预测)(二):数据分析 目录 数据挖掘实践(金融风控-贷款违约预测)(二):数据分析 1.引言 2.基本知识点 2.1缺失值(Missing data) 2.1.1缺失 ...
- python数据分析要学什么_python数据分析学什么?python数据分析入门
有很多没有基础的新手想学习python数据分析,却在纠结python数据分析难不难学?下面万古网校小编给大家整理了资料,为各位分享! 1.python难不难? Python可以说是目前比较主流而且易学 ...
- python 数据分析学什么-python数据分析学什么?python数据分析入门
有很多没有基础的新手想学习python数据分析,却在纠结python数据分析难不难学?下面万古网校小编给大家整理了资料,为各位分享! 1.python难不难? Python可以说是目前比较主流而且易学 ...
- 【数据分析入门】python数据分析全过程梳理与代码实现
文章目录 数据分析 数据获取 探索分析与可视化 预处理理论 分析建模 评估模型 数据分析 数据获取 [数据分析入门]python数据分析之数据获取方法 探索分析与可视化 [数据分析入门]python数 ...
- python数据分析可视化实例-Python数据分析与可视化从入门到精通
(1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果.(2)专注于Python数据分析与可视化操作中实际用到的技术.相比大而全的书籍资料,本书能让读者尽快上手,开始项目 ...
- 数据分析系列之Python数据分析简介
Python是一门简单易学且功能强大的编程语言,使其在许多领域成为编写脚本或开发应用程序理想语言 .Python被称作"胶水语言",是由于其运行效率的问题,将程序核心部分由C++等 ...
- 从零开始学python数据分析-从零开始学Python数据分析与挖掘 PDF 扫描版
给大家带来的一篇关于数据挖掘相关的电子书资源,介绍了关于Python.数据分析.数据挖掘方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小67.8 MB,刘顺祥编写,目前豆瓣.亚马逊.当当 ...
- python 数据分析学什么-python数据分析哪些课程好?
目前数据分析.机器学习的应用如火如荼,许多同学都有意参与到这股学习的热潮中来,但是令人苦恼的是,学习资料有很多,但是常常感觉无从下手. 这是因为,这里所涉及到的数据科学是一个综合学科,想掌握他需要熟练 ...
- 从零开始学python数据分析-从零开始学Python数据分析与挖掘 PDF 下载
资料目录: 目 录第1章 数据分析与挖掘概述 11.1 什么是数据分析和挖掘 11.2 数据分析与挖掘的应用领域 21.2.1 电商领域--发现破坏规则的"害群之马" 21.2.2 ...
最新文章
- 获取预制和获取gameObject
- android FloatingActionButton
- 利用Python进行数据分析-07-汇总和计算描述统计
- android-async-http 源码分析
- Linux du查看磁盘文件夹占用容量
- 顶尖机器学习学习路线,6个月让你的技术成为行业TOP5%
- python 之头像上传,预览
- 软件工程项目____搜查令
- 日久见人心,以小见大
- android studio 2.2 preview 3,Android Studio 2.2 Preview 3 发布,优化图片支持
- Oracle ERP Interface堵住--Request Running too long time,查找Request执行的Sql
- HTML第五章课后作业,第五章 组合逻辑电路 课后习题答案详解 资料资料资料.pdf...
- C盘爆满原来是腾讯电脑管家惹的祸
- worldpress php7.2,centos7.4下word press环境由php5.6.4升级到php7.2
- Unity 编辑器下运行没有声音
- 王立柱《c语言》3.5.4
- MyEclipse使用教程——使用DevStyle Icon Designer(二)
- 怎么剪切音频的一部分 去掉音频中的某段内容
- PCIe driver
- Echarts柱状图柱子点击事件
热门文章
- Http管理状态:Cooki与Session
- 校园市场开打:电信抢先、移动联通滞后
- 【喜报】华为OD统一考试(B卷)题库清单(已收录161题),更快,更全的 B 卷题库大纲
- Android下手机截屏
- Java Tomcat 以及Eclipse显示三只小猫咪图标
- rundeck用户权限管理
- 菜鸟—需求预测与分仓规划季军——“我们为R代言”团队赛后总结
- 后羿:我射箭了快上—用MotionLayout实现王者荣耀团战
- 物联网IoT协议之OPC UA快速入门教程
- Value '' can not be represented as java.sql.Timestamp