在对海量数据进行分析的过程中,我们可能要把文本型的数据处理成数值型的数据,方便放到模型中进行使用。也可能需要把数值型的数据分段进行处理,比如变量的woe化。而这些操作都可以借助python中的apply函数进行处理。

今天介绍数据分析的第四课,教大家如何在python中用apply函数对数据框进行一些复杂一点的操作。

本文目录

  1. 把字符型的数据处理成数值型

  2. 把数值型的数据分段处理

注意:本文沿用数据分析第一课【Python数据分析—数据建立】里的数据框date_frame:

 1   把字符型的数据处理成数值型

假设要在原数据框中把性别这一列,”男“字符替换成1、“女”字符替换成0,并生成一个新列。首先,可以自定义一个替换函数。具体语句如下:

def replace_gender_to_num(val):    if val=='男':        return 1    else:        return 0

然后用apply函数调用该函数,具体语句如下:

date_frame.gender.apply(replace_gender_to_num)

得到结果如下:

至此,原gender列中“男”字符替换成1,“女”字符替换成0。把该列加入到原数据框中去,具体语句如下:

date_frame['new_gender'] = date_frame.gender.apply(replace_gender_to_num)

得到结果如下:

可以发现性别为男,在new_gender中对应值为1,性别为女在new_gender中对应值为0。

 2   把数值型的数据分段处理

在建模过程中,要把不同分段的值转化成对应的woe,需要用到apply函数进行处理。类似的,在这个实例中假设要把身高高于1.8的同学当成第一类,身高高于1.65的当成第二类,其余的同学当成第三类。可以定义一个如下转换函数:

def height_to_class(val):    if val>=1.8:        return 1    elif val>=1.65:        return 2    else:        return 3

然后用apply函数调用该函数,并把得到的结果值保存到原数据框中去,具体语句如下:

date_frame['heigth_class'] = date_frame.height.apply(height_to_class)

得到结果如下:

至此,在python中应用apply函数进行数据处理已介绍完毕,大家可以动手练习一下,思考一下apply函数还有没有别的用途

往期回顾:3D星空图3D星空图V2版520表白代码合集用python绘制皮卡丘

娱乐圈排行榜动态条形图绘制

扫一扫关注我

19967879837

投稿微信

woe分析_Python数据分析—apply函数相关推荐

  1. 程度性数据python分析_python数据分析实战之AQI分析

    文章目录 1.数据分析的基本流程 2.明确需求和目的 2.1 需求和目的 3.数据收集 4.数据预处理 4.1 数据整合 4.1.1 加载相关库和数据集 4.1.2 数据总体概览 4.2 数据清洗 4 ...

  2. python的seaborn用于可视化分析_Python数据分析-可视化“大佬”之Seaborn

    如果有想关注Java开发相关的内容,可以转 上次学习了如何使用Matplolib进行数据可视化,接下来让我们来看看另一个可视化工具--seaborn Seaborn 既然有了matplotlib,那为 ...

  3. python信用卡违约预测分析_Python数据分析及可视化实例之银行信用卡违约预测(24)...

    1.项目背景: 银行体系对于信用可违约进行预测,原始数据集如下: 2.分析步骤: (1)数据清洗(Data Cleaning) (2) 探索性可视化(Exploratory Visualization ...

  4. python猫眼电影分析_Python数据分析之猫眼电影TOP100

    前言 如果大家经常阅读Python爬虫相关的公众号,都会是以爬虫+数据分析的形式展现的,这样很有趣,图表也很不错,今天了,我就来分享上一次在培训中的一个作品:猫眼电影爬虫及分析. 通过猫眼电影TOP1 ...

  5. python产品质量分析_Python数据分析实战之葡萄酒质量分析

    1. 明确需求和目的 以葡萄酒类型为标签,分为白葡萄酒和红葡萄酒.比较这两种葡萄酒的差别并选取葡萄酒的化学成分:固定酸度.挥发性酸度.柠檬酸.氯化物.游离二氧化硫.总硫度.密度.PH值.硫酸盐.酒精度 ...

  6. python数据包分析_python | 数据分析(一)- Numpy数据包

    # 导入numpy包 import numpy as np """ ***************** 一.数组操作 ***************** "&q ...

  7. pandas数据分析实战之apply函数应用

    使用apply函数与字符匹配进行数据分析 1.apply函数使用 2.字符串匹配 3.数据分析实战 1.apply函数使用 DataFrame.apply(self, func, axis=0, ra ...

  8. python数据分析函数大全_python中数据分析常用函数整理

    一. apply函数 作用:对 DataFrame 的某行/列应用函数之后,Apply 返回一些值.函数既可以使用默认的,也可以自定义.注意:在第二个输出中应用 head() 函数,因为它包含了很多行 ...

  9. pythonpandas分析数据_python 数据分析--pandas

    接下来pandas介绍中将学习到如下8块内容: 1.数据结构简介:DataFrame和Series 2.数据索引index 3.利用pandas查询数据 4.利用pandas的DataFrames进行 ...

最新文章

  1. 某程序员女友爆料:男朋友和公司的UI搞到了一起!女UI段位太高!半夜公然打电话挑衅!
  2. iMeta | 中科院生态中心邓晔组发布微生物组网络分析平台iNAP(图文/视频教程)
  3. Hyper-v Server重复数据删除技术
  4. 暑期训练日志----2018.8.9
  5. UE3 虚幻编辑器控制台命令
  6. 百度搜索关键字抓取_怎么使百度竞价的效益最大化
  7. [企业内部https证书配置]tomcat 7配置https的完整历程
  8. python-迭代器实现异步(在串行中)
  9. Mybatis Generator的使用 1
  10. 大数据分析五步法流程顺序
  11. 基于蚁群算法求解求解TSP问题(JAVA)
  12. h5与微信小程序直播开发
  13. PyQt5+VTK环境搭建
  14. 乐高ev3python教程_入门篇丨使用EV3机器人,趣味学习Python编程语言~
  15. from_tensor_slices
  16. 国内外证券交易系统开发平台比较
  17. .jnlp 文件打开方式
  18. 物联计算机大赛,“翼灵杯”第七届物联网创意大赛成功举办
  19. 超声波传感器介绍及其使用(STM32)
  20. php 中文转义问题

热门文章

  1. 开放才能进步!Angular和Wijmo一起走过的日子
  2. 靠谱的div引入任何外链内容
  3. TJOI2018Party
  4. markdown-Macdown
  5. win10 hyper-v 虚拟机ping不通宿主机问题
  6. C语言结构体及函数传递数组參数演示样例
  7. [ Javascript ] JavaScript中的定时器(Timer) 是怎样工作的!
  8. Android下Opengl ES实现单屏幕双眼显示
  9. Spark Streaming整合logstash + Kafka wordCount
  10. 平衡二叉树,AVL树之图解篇