特征不同取值/区间下 label 的均值曲线
def two_plot(df, feat, tick_label=None, rotate_tick=60):
print('\n### 不同取值/区间下 label 的均值曲线')
fig, ax1 = plt.subplots()
proportions = df[feat].value_counts().sort_index() / df.shape[0]
x = proportions.index
y1 = proportions.values
y2 = df.groupby(feat).label.mean().sort_index().values
ax1.bar(range(len(x)), y1, color='b', tick_label=tick_label if tick_label else x)
feat_name = feat.split('_bins_code')[0]
#x_label = feat_comments[feat_name]
x_label = feat
ax1.set_xlabel(x_label)
ax1.set_ylabel('sample number ratio')
if rotate_tick:
for tick in ax1.get_xticklabels():
tick.set_rotation(90)
ax2 = ax1.twinx()
ax2.plot(y2, color='r')
ax2.set_ylabel('DPD30+ ratio')
plt.show()
overdue_df['label'] = overdue_df.max_overperiod_his.apply(lambda x: 0 if x<30 else 1)
feat = 'rev1m_messagetab_pv' #'rev6m_data05' #'rev3m_messagetab_pv'
bins = [-0.1,50, 200, 500, 1000, 5000, 10000, 15000] # 自己定义下分段
df[feat + '_bins'] = pd.cut(df[feat], bins=bins)
two_plot(overdue_df, feat + '_bins')
转载于:https://www.cnblogs.com/xinping-study/p/8573284.html
特征不同取值/区间下 label 的均值曲线相关推荐
- matlab中的bar3()函数的x-y轴的区间取值方法
一.bar3(Z)的用法 在matlab中,可以使用bar3()函数来解决三维的柱状图绘制问题,假设有下面的代码,得到图像为: a = [1,1,1;2,2,2;3,3,3] bar3(a); 二.b ...
- 取值方法_数据维度爆炸怎么办?详解 5 大常用的特征选择方法
公众号关注 "ML_NLP"设为 "星标",重磅干货,第一时间送达! 转自 | DataWhale 在许多机器学习相关的书里,很难找到关于特征选择的内容,因为特 ...
- C语言浮数据范围和字节,C语言各种数据类型在系统中占的字节和取值范围.docx...
基本类型包括字节型(char).整型(int)和浮点型(float/double). 定义基本类型变量时,可以使用符号属性signed.unsigned(对于char.int),和长度属性short. ...
- 【参数】REMOTE_LOGIN_PASSWORDFILE参数三种取值及其行为特性分析
在某些情况下可以使用REMOTE_LOGIN_PASSWORDFILE参数增强系统的安全性,所谓提高安全性就是禁止以SYSDBA或SYSOPER特权用户从客户端登陆到数据库系统中.这是一种牺牲管理便捷 ...
- 从多个Word文档中批量取值,整理到Excel表中的技能,整理简历者必备
从多个Word文档中批量取值,整理到Excel表中的技能,整 从多个Word文件中提取指定的值到Excel中,也可以理解为把多个Word文件的值放在一个表格中,便于统计或查阅. 本教材提供了4种不同情 ...
- matlab 产生取值介于a到b之间的满足正态(高斯)分布的随机数/数组/矩阵
matlab中现有的产生满足正态分布随机数的函数主要有: randn和normrnd 有关randn的应用可以参考: https://ww2.mathworks.cn/help/matlab/ref/ ...
- c语言字节范围,C语言各种数据类型在系统中占的字节和取值范围
基本类型包括字节型(char).整型(int)和浮点型(float/double). 定义基本类型变量时,可以使用符号属性signed.unsigned(对于char.int),和长度属性short. ...
- 多取值离散型特征工程_特征工程(完)
机器学习入门系列(2)--如何构建一个完整的机器学习项目,第六篇! 这也是特征工程系列最后一篇文章,介绍特征提取.特征选择.特征构建三个工作,通常特征工程被认为分为这三方面的内容,只是我将前面的数据& ...
- xm-select树形下拉框渲染,取值,赋值
//下拉树渲染 <div id="demo3" class="xm-select-demo" style="width: 300px;" ...
最新文章
- bzoj1814 Ural 1519 Formula 1(插头dp模板题)
- 互联网运营面试题_产品运营成长必修课:做好项目复盘
- 用css3实现ps蒙版效果+动画
- Sqlite3 for Linux 可视化工具
- java模拟连接超时_Java:使用Toxiproxy模拟各种连接问题
- springboot如何对本地数据库增删改查_SpringBoot整合Mybatis实现数据库增删改查
- vi+ctags+cscope联合使用
- 最大化参数 火车头_新手必看的火车头采集器使用入门教程_图文解说版!(看完包会)...
- c语言pi算法程序,C语言计算圆周率PI
- matlab心电信号特征提取
- VUE查询本周、本月、本季度
- Python eval() 函数看这里就够了
- mysql leader/followers_Leader/Followers 模式
- 微信小程序调用扫一扫
- RGBA、YUV色彩格式及libyuv的使用
- 东财量化接口怎么获取?
- 真香!红色警戒游戏源代码被开源了!
- python算法—1234能组成不重复3位数
- 数据库实验4 SQL语言-SELECT查询操作
- php实现aes ecb模式加密,PHP、Python、Java的AES ECB加密实现-Fun言
热门文章
- 下方向键_求助:Deepin-linux-opencv方向键
- python 自定义函数语句_python 自定义函数
- 你会采取什么方法改进你的测试用例_自闭症孩子在公共场所哭闹、撒泼打滚,你会采取什么措施?...
- CSS浏览器兼容性的4个解决方案:浏览器CSS样式初始化、浏览器私有属性,CSS hack语法和自动化插件...
- 谁需要这件礼物?每一个爱学习的人!
- 训练第一个机器学习模型
- Mac 10.12安装IntelliJ出品的数据库管理工具DataGrip
- hibernate和struts实现分页
- iptables上课内容
- 影响Unix多版 FTP曝严重远程执行漏洞