1.项目背景:

银行体系对于信用可违约进行预测,原始数据集如下:

2.分析步骤:

(1)数据清洗(Data Cleaning)

(2) 探索性可视化(Exploratory Visualization)

(3) 特征工程(Feature Engineering)

(4)基本建模&评估(Basic Modeling& Evaluation)

3.源码(公众号:海豹战队):

# coding: utf-8

# 亲,转载即同意帮推公众号:海豹战队,嘿嘿......

# 数据源可关注公众号:海报战队,后留言:数据

import pandas as pd

filename = '../data/bankloan.xls'

data = pd.read_excel(filename)

data.head()

x = data.drop('违约',axis=1) # 舍弃违约列进行训练

y = data['违约'] # y标签为‘违约’列

# y.unique()

from sklearn.linear_model import LogisticRegression as LR

from sklearn.linear_model import RandomizedLogisticRegression as RLR

rlr = RLR() #建立随机逻辑回归模型,筛选变量

rlr.fit(x, y) #训练模型

rlr.get_support() #获取特征筛选结果,也可以通过.scores_方法获取各个特征的分数

print('通过随机逻辑回归模型筛选特征结束。')

print('有效特征为:%s' % ','.join(x.columns[rlr.get_support()]))

x= x[x.columns[rlr.get_support()]] # 选择有效特征列进行模型训练

#x.head()

lr = LR() #建立逻辑回归模型

lr.fit(x, y) #用筛选后的特征数据来训练模型

print('逻辑回归模型训练结束。')

print('模型的正确率为:%s' % lr.score(x, y)) #给出模型的平均正确率,本例为81.4%

lr.predict([[10,6,17.3,1.362202]]) # 挑第二个人给预测一下

lr.predict([[10,6,17.3,10.362202]])# 提高第二个人的负债再预测,自己看看差别

# 建议以上代码在jupyter notebook 分段执行,查看结果。

新手可查阅历史目录:

最后,别只收藏不关注哈

python信用卡违约_Python数据分析及可视化实例之银行信用卡违约预测(24)相关推荐

  1. python信用卡违约预测分析_Python数据分析及可视化实例之银行信用卡违约预测(24)...

    1.项目背景: 银行体系对于信用可违约进行预测,原始数据集如下: 2.分析步骤: (1)数据清洗(Data Cleaning) (2) 探索性可视化(Exploratory Visualization ...

  2. python房价数据挖掘_Python数据分析及可视化实例之帝都房价预测

    数据集下载易一网络科技 - 付费文章​www.intumu.com 加载数据 import pandas as pd df=pd.read_csv("MYUNOI.csv") # ...

  3. python数据分析可视化实例_Python数据分析及可视化实例之基于Kmean分析RFM进行用户关怀...

    系列文章总目录:Python数据分析及可视化实例目录 数据集下载 Python数据分析及可视化实例之全国各城市房价分析(含数据采集) Python数据分析及可视化实例之帝都房价预测 Python数据分 ...

  4. python从mongodb里取出数据进行可视化_Python数据分析及可视化实例之MongoDB增删改查...

    1.MongoDB安装 有时候度娘还是给力的,相反一些博客的安装方法则显得凌乱: 最初使用Win7安装经常会出现意料不到的错误, 比如开机启动服务,服务器日志等. 上面链接安装步骤简单,没有炫技的成分 ...

  5. python数据预测案例_Python数据分析及可视化实例之疾病预测(分类)

    Talk is cheap , show U the code. 该源码注释比较全面,需要对SKlearn有一定的了解, 当然,你也可以把它视作黑箱,做个调包侠也是大侠, 没错,本主用Bokeh进行可 ...

  6. python分析数据走势_Python数据分析及可视化实例之个股走势预测(26)

    1.项目背景: 仅仅用来练手,个股走势如果真预测准确了,都就改行当操盘手了,哈哈! 但话又说回来,如果把数据曲线特征提取出来,再进行对比异常判断,也是可以的. 数据源,请关注微信公众号:海豹战队,回复 ...

  7. python数据分析实例_Python数据分析及可视化实例之爬虫源码(05)

    1.背景介绍 (1)在注册了某网站之后,发现站内个人页面有个关于京杭大运河的征文.再加上之前,九寨沟地震第一时间机器人写了一篇通讯稿.于是我就在想,既然机器可以写通讯稿,那么是不是也可以用来写篇关于京 ...

  8. mongodb 3.4 安装_Python数据分析及可视化实例之CentOS7.2+MongoDB V3.4 安装

    系列文章总目录:Python数据分析及可视化实例目录 我不是程序员,也不是设计师,我只是碰巧有一些想法和一台电脑. I am not a designer nor a coder. I'm just ...

  9. jupyter 数据分析可视化案例_Python数据分析及可视化实例之Anaconda、Jupyter简介

    系列文章总目录:Python数据分析及可视化实例目录 简介部分依然是搬运工的活, 尽可能搬点有用的少占地方. 1.Anaconda 在win平台下用Anaconda再好不过了, 基本上继承了所有数据分 ...

最新文章

  1. android中获取图片、获取图片像素、处理像素等基础知识
  2. 遍历list、set、map和array
  3. 流行的9个Java框架介绍: 优点、缺点等等
  4. 怎样才不浪费IP的价值?
  5. How research looks?
  6. linux写一个脚本杀进程,linux下如何自动检测并重新启动一个死掉的进程,然后再把它杀死:)(shell脚本实现)...
  7. Autosys command
  8. 怎么使用socket在云服务上通信步骤(可支持TCP或UDP)
  9. 进阶– Java EE 7前端5强
  10. mysql 存储过程已存在_sql存储过程实现 添加新用户,判断是否已存在
  11. 初学者web前端知识点--HTML部分
  12. Spring Boot整合MongoDB实现增删改查
  13. Android app 跳转微信小程序
  14. 即将“再次”免费的JDK
  15. RabbitMQ的学习笔记
  16. 点线面的意义_聊聊「点线面」的概念
  17. matlab湿度廓线,中国气象数据网
  18. 【教程+实例】Python爬虫实例——用Python爬虫爬取bangumi上的galgame资讯
  19. 云服务器liunx系统怎么安装,云服务器怎么安装linux系统
  20. 怎样合理使用键盘以及键盘的保养方法

热门文章

  1. sumif三个条件怎么填_Excel条件求和函数sumif详解及应用
  2. 计算机及网络应用基础思维导图_计算机基础/算法/面试题 PDF+思维导图下载
  3. ICMP隧道工具ptunnel
  4. Xamarin XAML语言教程基本页面ContentPage占用面积
  5. Arduino可穿戴教程保存源文件与打开已经存在的源文件
  6. iOS10 UI教程视图的生命周期
  7. 网页图表Highcharts实践教程之图表区
  8. mysql主主和F5高可用_MYSQL 主主热备高可用方案与实现
  9. Frontiers期刊向您邀稿啦!脑机接口领域
  10. 英特尔图形学专家被AMD挖走,研发实时光追技术,从部门主管变成副总裁