def two_plot(df, feat, tick_label=None, rotate_tick=60):
print('\n### 不同取值/区间下 label 的均值曲线')
fig, ax1 = plt.subplots()
proportions = df[feat].value_counts().sort_index() / df.shape[0]
x = proportions.index
y1 = proportions.values
y2 = df.groupby(feat).label.mean().sort_index().values
ax1.bar(range(len(x)), y1, color='b', tick_label=tick_label if tick_label else x)
feat_name = feat.split('_bins_code')[0]
#x_label = feat_comments[feat_name]
x_label = feat
ax1.set_xlabel(x_label)
ax1.set_ylabel('sample number ratio')
if rotate_tick:
for tick in ax1.get_xticklabels():
tick.set_rotation(90)

ax2 = ax1.twinx()
ax2.plot(y2, color='r')
ax2.set_ylabel('DPD30+ ratio')
plt.show()

overdue_df['label'] = overdue_df.max_overperiod_his.apply(lambda x: 0 if x<30 else 1)
feat = 'rev1m_messagetab_pv' #'rev6m_data05' #'rev3m_messagetab_pv'
bins = [-0.1,50, 200, 500, 1000, 5000, 10000, 15000] # 自己定义下分段
df[feat + '_bins'] = pd.cut(df[feat], bins=bins)

two_plot(overdue_df, feat + '_bins')

转载于:https://www.cnblogs.com/xinping-study/p/8573284.html

特征不同取值/区间下 label 的均值曲线相关推荐

  1. matlab中的bar3()函数的x-y轴的区间取值方法

    一.bar3(Z)的用法 在matlab中,可以使用bar3()函数来解决三维的柱状图绘制问题,假设有下面的代码,得到图像为: a = [1,1,1;2,2,2;3,3,3] bar3(a); 二.b ...

  2. 取值方法_数据维度爆炸怎么办?详解 5 大常用的特征选择方法

    公众号关注 "ML_NLP"设为 "星标",重磅干货,第一时间送达! 转自 | DataWhale 在许多机器学习相关的书里,很难找到关于特征选择的内容,因为特 ...

  3. C语言浮数据范围和字节,C语言各种数据类型在系统中占的字节和取值范围.docx...

    基本类型包括字节型(char).整型(int)和浮点型(float/double). 定义基本类型变量时,可以使用符号属性signed.unsigned(对于char.int),和长度属性short. ...

  4. 【参数】REMOTE_LOGIN_PASSWORDFILE参数三种取值及其行为特性分析

    在某些情况下可以使用REMOTE_LOGIN_PASSWORDFILE参数增强系统的安全性,所谓提高安全性就是禁止以SYSDBA或SYSOPER特权用户从客户端登陆到数据库系统中.这是一种牺牲管理便捷 ...

  5. 从多个Word文档中批量取值,整理到Excel表中的技能,整理简历者必备

    从多个Word文档中批量取值,整理到Excel表中的技能,整 从多个Word文件中提取指定的值到Excel中,也可以理解为把多个Word文件的值放在一个表格中,便于统计或查阅. 本教材提供了4种不同情 ...

  6. matlab 产生取值介于a到b之间的满足正态(高斯)分布的随机数/数组/矩阵

    matlab中现有的产生满足正态分布随机数的函数主要有: randn和normrnd 有关randn的应用可以参考: https://ww2.mathworks.cn/help/matlab/ref/ ...

  7. c语言字节范围,C语言各种数据类型在系统中占的字节和取值范围

    基本类型包括字节型(char).整型(int)和浮点型(float/double). 定义基本类型变量时,可以使用符号属性signed.unsigned(对于char.int),和长度属性short. ...

  8. 多取值离散型特征工程_特征工程(完)

    机器学习入门系列(2)--如何构建一个完整的机器学习项目,第六篇! 这也是特征工程系列最后一篇文章,介绍特征提取.特征选择.特征构建三个工作,通常特征工程被认为分为这三方面的内容,只是我将前面的数据& ...

  9. xm-select树形下拉框渲染,取值,赋值

    //下拉树渲染 <div id="demo3" class="xm-select-demo" style="width: 300px;" ...

最新文章

  1. bzoj1814 Ural 1519 Formula 1(插头dp模板题)
  2. 互联网运营面试题_产品运营成长必修课:做好项目复盘
  3. 用css3实现ps蒙版效果+动画
  4. Sqlite3 for Linux 可视化工具
  5. java模拟连接超时_Java:使用Toxiproxy模拟各种连接问题
  6. springboot如何对本地数据库增删改查_SpringBoot整合Mybatis实现数据库增删改查
  7. vi+ctags+cscope联合使用
  8. 最大化参数 火车头_新手必看的火车头采集器使用入门教程_图文解说版!(看完包会)...
  9. c语言pi算法程序,C语言计算圆周率PI
  10. matlab心电信号特征提取
  11. VUE查询本周、本月、本季度
  12. Python eval() 函数看这里就够了
  13. mysql leader/followers_Leader/Followers 模式
  14. 微信小程序调用扫一扫
  15. RGBA、YUV色彩格式及libyuv的使用
  16. 东财量化接口怎么获取?
  17. 真香!红色警戒游戏源代码被开源了!
  18. python算法—1234能组成不重复3位数
  19. 数据库实验4 SQL语言-SELECT查询操作
  20. php实现aes ecb模式加密,PHP、Python、Java的AES ECB加密实现-Fun言

热门文章

  1. 下方向键_求助:Deepin-linux-opencv方向键
  2. python 自定义函数语句_python 自定义函数
  3. 你会采取什么方法改进你的测试用例_自闭症孩子在公共场所哭闹、撒泼打滚,你会采取什么措施?...
  4. CSS浏览器兼容性的4个解决方案:浏览器CSS样式初始化、浏览器私有属性,CSS hack语法和自动化插件...
  5. 谁需要这件礼物?每一个爱学习的人!
  6. 训练第一个机器学习模型
  7. Mac 10.12安装IntelliJ出品的数据库管理工具DataGrip
  8. hibernate和struts实现分页
  9. iptables上课内容
  10. 影响Unix多版 FTP曝严重远程执行漏洞