数据处理涉及以各种格式处理数据,例如合并,分组,连接等,以便分析或准备将其与另一组数据一起使用。 python具有内置函数功能,可将这些争议方法应用于各种数据集以实现分析目标。 在本章中,我们将看几个基于这些方法的例子。

合并数据

python中的pandas库提供了一个函数merge,作为dataframe对象之间所有标准数据库连接操作的入口 -

pd.merge(left, right, how='inner', on=none, left_on=none, right_on=none,

left_index=false, right_index=false, sort=true)

现在创建两个不同的dataframe并对其执行合并操作。

# import the pandas library

import pandas as pd

left = pd.dataframe({

'id':[1,2,3,4,5],

'name': ['alex', 'amy', 'allen', 'alice', 'ayoung'],

'subject_id':['sub1','sub2','sub4','sub6','sub5']})

right = pd.dataframe(

{'id':[1,2,3,4,5],

'name': ['billy', 'brian', 'bran', 'bryce', 'betty'],

'subject_id':['sub2','sub4','sub3','sub6','sub5']})

print (left)

print (right)

执行上面示例代码,得到以下结果 -

name id subject_id

0 alex 1 sub1

1 amy 2 sub2

2 allen 3 sub4

3 alice 4 sub6

4 ayoung 5 sub5

name id subject_id

0 billy 1 sub2

1 brian 2 sub4

2 bran 3 sub3

3 bryce 4 sub6

4 betty 5 sub5

分组数据

数据分析中经常需要对数据集进行分组,因为我们需要根据数据集中存在的各个组的结果进行分析。 panadas具有内置的方法,可以将数据转换为各种分组。

在下面的示例中,我们按年分组数据,然后获得特定年份的结果。

# import the pandas library

import pandas as pd

ipl_data = {'team': ['riders', 'riders', 'devils', 'devils', 'kings',

'kings', 'kings', 'kings', 'riders', 'royals', 'royals', 'riders'],

'rank': [1, 2, 2, 3, 3,4 ,1 ,1,2 , 4,1,2],

'year': [2014,2015,2014,2015,2014,2015,2016,2017,2016,2014,2015,2017],

'points':[876,789,863,673,741,812,756,788,694,701,804,690]}

df = pd.dataframe(ipl_data)

grouped = df.groupby('year')

print (grouped.get_group(2014))

执行上面示例代码,得到以下结果 -

points rank team year

0 876 1 riders 2014

2 863 2 devils 2014

4 741 3 kings 2014

9 701 4 royals 2014

连接数据

pandas提供了各种功能,可以轻松地将series,dataframe和panel对象组合在一起。 在下面的例子中,concat函数沿轴执行串联操作。创建不同的对象并进行连接。

import pandas as pd

one = pd.dataframe({

'name': ['alex', 'amy', 'allen', 'alice', 'ayoung'],

'subject_id':['sub1','sub2','sub4','sub6','sub5'],

'marks_scored':[98,90,87,69,78]},

index=[1,2,3,4,5])

two = pd.dataframe({

'name': ['billy', 'brian', 'bran', 'bryce', 'betty'],

'subject_id':['sub2','sub4','sub3','sub6','sub5'],

'marks_scored':[89,80,79,97,88]},

index=[1,2,3,4,5])

print (pd.concat([one,two]))

执行上面示例代码,得到以下结果 -

marks_scored name subject_id

1 98 alex sub1

2 90 amy sub2

3 87 allen sub4

4 69 alice sub6

5 78 ayoung sub5

1 89 billy sub2

2 80 brian sub4

3 79 bran sub3

4 97 bryce sub6

5 88 betty sub5

python中噪音是什么意思_Python数据噪音相关推荐

  1. [转载] python中for语句用法_详解Python中for循环的使用_python

    参考链接: 在Python中将else条件语句与for循环一起使用 这篇文章主要介绍了Python中for循环的使用,来自于IBM官方网站技术文档,需要的朋友可以参考下 for 循环 本系列前面 &q ...

  2. python中for语句用法_详解Python中for循环的使用_python

    这篇文章主要介绍了Python中for循环的使用,来自于IBM官方网站技术文档,需要的朋友可以参考下 for 循环 本系列前面 "探索 Python,第 5 部分:用 Python 编程&q ...

  3. b是python文件二进制打开_如何在Python中打开和显示原始二进制数据?

    'rb'模式允许您从Python中的文件读取原始二进制数据:with open(filename, 'rb') as file: raw_binary_data = file.read() type( ...

  4. python读取json数据格式问题_浅谈Python中的异常和JSON读写数据的实现

    异常可以防止出现一些不友好的信息返回给用户,有助于提升程序的可用性,在java中通过try ... catch ... finally来处理异常,在Python中通过try ... except .. ...

  5. Python中通过索引名称提取数据loc()函数Python中通过行和列下标提取数据iloc()函数

    [小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中通过索引名称提取数据 loc()函数 Python中通过 ...

  6. 在python中创建Excel文件并写入数据

    来源:<在python中创建Excel文件并写入数据> python中的包xlwt和xlsxwriter都是比较方便创建excel文件并写入数据的. xlwt中: 通过xlwt.Workb ...

  7. python中输出字体大小改变_python中变量的输入与输出

    python中变量的输入与输出 <1>输出 python中变量的输出 # 打印提示print('hello world')print('给我的卡---印度语,你好的意思')# 输出变量ur ...

  8. python中字符串切片取奇数_Python中的字符串切片(截取字符串)的详解

    Python中的字符串切片(截取字符串)的详解 字符串索引示意图 字符串切片也就是截取字符串,取子串 Python中字符串切片方法 字符串[开始索引:结束索引:步长] 切取字符串为开始索引到结束索引- ...

  9. python中异或怎么算_python 异或运算的前提_异或运算公式

    Python基础(10)–数字-Python-第七城市 609x288 - 73KB - JPEG Python基础(10)--数字_资讯_突袭网 609x288 - 33KB - JPEG pyth ...

最新文章

  1. 文件系统vs对象存储——选型和趋势
  2. ES6基础2(块级作用域、数组对象解构)-学习笔记
  3. C# 11 预览,又增加了实用的语法糖
  4. eq相等,smarty 比较操作符!时间戳
  5. 程序员面试金典 - 面试题 03.06. 动物收容所(队列)
  6. linux无限刷屏代码,linux下如何实现简单刷屏
  7. 今天说说微博中的“飞秋下载”
  8. 农行软开是总行编制吗_2021农行总行校招笔试来啦,你知道农行笔试都考些什么吗?...
  9. EC++学习笔记(四) 设计与声明
  10. SDI在自定义的工具栏上添加下拉控件
  11. 编程基本功:做自解释的测试文档
  12. 单片机编程用什么软件?单片机开发软件有哪些?
  13. 解决打开pdf时“在禁用UAC时,无法激活此应用”
  14. 开始学习爬虫:爬虫之爬取电影天堂网站资源到本地mysql数据库
  15. 投毒后门防御阅读笔记,What Doesn‘t Kill You Makes You Robust (er) Adversarial Training against Poisons and Back
  16. 电脑自动打开代理服务器无法上网解决方案
  17. HUST1005 渊子赛马【枚举】
  18. win10环境下Android SDK下载安装及配置教程
  19. AIR - 网页系统回到桌面应用
  20. linux 终端命令行的快捷键列表

热门文章

  1. Hibernate笔记——9.关联映射(下)
  2. secureCRT自动断开的解决方法
  3. Mac OS 下安装 MacVim
  4. Silverlight运行原理经典问答。
  5. 不删除文件,清空文件内容命令
  6. JavaScript 中 void(0) 的含义
  7. Java项目:基于SSM实现房屋租赁系统
  8. 构造器与一般方法对比
  9. C# 获取进程或线程的相关信息
  10. UOJ37. 【清华集训2014】主旋律