代码

import pandas as pd
ages=[15,16,19,20,25,30,35,36,37,40]#年龄
bins=[10,15,20,25,30,35,40]#10到15一组15到20一组其余类推
agesgroup=pd.cut(ages,bins)

生成的这个agesgroup是一个特殊的Categorical对象。

agesgroup.value_counts()

(10,15]这个组有一个
(15,20]这个组有三个

agesgroup.codes


这里的[0,1,1,1,2,3,4,5,5,5]是说第一个数15属于第0组即(10,15]这一组,16属于第一组即(15,20]这一组,依次类推。

agesgroup.categories

这里的 closed='right’表示的是区间是右边封闭的。

python年龄分组(分箱)相关推荐

  1. python 等深分箱 等宽分箱结合二分箱的数据分析

    python 等深分箱 等宽分箱结合二分箱的数据分析 等深分箱等宽分箱概述 Python里可以通过pcut(等深分箱即每箱的样本量基本一致)和cut(等宽分箱即样本量之间有相同的宽度)对样本进行分箱. ...

  2. python 卡方分箱算法_特征工程 - 分箱

    卡方分箱 python自帶分箱函數  --  無法實現對分類型數據的分箱,可借助卡方分箱算法實現 import numpy as np import pandas as pd data = np.ra ...

  3. python最优分箱计算iv值_Python计算woe和iv值

    计算逻辑 先计算WOE值,再计算IV值. 其中Y或N分别是YES,NO,反应在因变量中,就是1和0. Yi是第i组中1的个数,YT是所有(Total)为1的个数. Ni是第i组中0的个数,NT是所有( ...

  4. python 卡方分箱算法_python实现二分类的卡方分箱示例

    解决的问题: 1.实现了二分类的卡方分箱: 2.实现了最大分组限定停止条件,和最小阈值限定停止条件: 问题,还不太清楚,后续补充. 1.自由度k,如何来确定,卡方阈值的自由度为 分箱数-1,显著性水平 ...

  5. python 数据处理之分箱操作

    什么是分箱? 简单点说就是将不同的东西,按照特定的条件放到一个指定容器里,比如水果 把绿色的放一个篮子里,红色一个篮子等等,这个篮子就是箱,而水果就是数据 颜色就是条件 什么样式的数据要进行分箱 数据 ...

  6. python卡方分箱_机器学习(十六)特征工程之数据分箱

    1 分箱简介 数据分箱(也称为离散分箱或分段)是一种数据预处理技术,用于减少次要观察误差的影响,是一种将多个连续值分组为较少数量的"分箱"的方法. 例如,例如我们有一组关于人年龄的 ...

  7. python卡方分箱_Python评分卡建模—卡方分箱

    为服从自由度为k的卡方分布,记作: 或者记作 . 二.卡方检验 χ2检验是以χ2分布为基础的一种假设检验方法,主要用于分类变量之间的独立性检验. 其基本思想是根据样本数据推断总体的分布与期望分布是否有 ...

  8. R语言︱噪声数据处理、数据分组——分箱法(离散化、等级化)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 分箱法在实际案例操作过程中较为常见,能够将一些 ...

  9. python最优分箱计算iv值_GitHub - zhaoxingfeng/WOE: Weight of Evidence,基于iv值最大思想求最优分箱...

    WOE WOE Transformation常用于信用风险评分卡(Credit Risk Scorecard)模型中,采用分箱的方式对原始特征进行非线性映射.常见的分箱方法有等宽分箱.等频分箱.最优分 ...

最新文章

  1. px像素如何转为dip设备独立像素设备独立像
  2. python有用吗-python有用么
  3. PowerDesigner的使用二
  4. 【带着canvas去流浪】 (3)绘制饼图
  5. javascript进阶——Ajax
  6. python爬取抖音评论_爬取抖音299w用户数据后的分析
  7. java android开发框架_android开发的三大框架是什么?
  8. KEIL中加入GD设备文件
  9. HTML+CSS+JS制作炫酷特效代码
  10. 华为P7安装Linux,华为P7插卡步骤图解 华为P7电信/移动/联通版手机sim卡安装使用教程...
  11. Rasa原文-生成NLU数据
  12. 电商后台管理系统订单列表模块
  13. oracle查询数据令某字段显示固定值
  14. 通讯测试工具和博图仿真机的连接教程
  15. ffmpeg批量转换flac为wav,m4a转换为wav,批量删除目录下某一后缀名文件,复制文件中有相同部分的文件
  16. winmail 数据库设置_企业邮箱winmail设置方法
  17. UE4官方文档学习笔记材质篇——UV坐标动画,凹凸贴图偏移
  18. 2007年新兴网络服务
  19. vs2019无法连接到远程服务器,VS2019无法添加引用问题
  20. 《PHP和MySQL WEB开发》第六章笔记

热门文章

  1. 世界上最玄的10个巧合!
  2. 国际绝对音名标准频率定义(32位无符号整型精度、十二等律体系、A4=440.01000Hz)
  3. Toolstrip 工具栏控件
  4. 自己制作deb包(转)
  5. Java如何生成花里胡哨的二维码
  6. 计算机操作系统简答题综合题
  7. GnuCash 3.5 发布,跨平台财务管理软件
  8. dell服务器卡在启动界面_Dell PowerEdge 服务器启动指南
  9. 数学建模初始-建立数学模型
  10. VMware虚拟机安装Linux系统教程