前两天我的笔记本电脑出问题了,拿到联想3C服务区修,耽搁了一些时间,然后用手机写了一些内容,今天把前几天学习的内容给补上。
今天首先是简单记录一下自己学习的pandas。同样的,练习的代码放到我的GitHub上:https://github.com/noDreamNoLife/hugay

1. pandas

1.1 series

首先series它可以看成一个类似数组的结构,它其实是一组数据和其索引组成的一种结构,一组简单的数据就可以是一个series结构。

# Series
obj = Series([1, 2, 3, 4, 5])
print(obj)
print(obj.index)
print(obj.values)# 自定义索引
obj = Series([1, 2, 3, 4, 5], index=(1, 2, 3, 4, 5))
print(obj)# series还可以看成字典的形式
data = {'a': 1, 'b': 2, 'c': 3}
obj = Series(data)
print(obj)
keys = ['a','c']
obj_1 = Series(data,index=keys)
print(obj_1)# series中简单的缺失值判断与处理
data = {'a':None,'b': 2, 'c': 3}
obj = Series(data)
print(pd.isnull(obj))
print((obj.isnull()))# 自定义索引名
data = {'xiaohu':None,'xiaodai': 2, 'xiaowang': 3}
obj = Series(data)
obj.name = 'xingminghemingzi'
obj.index.name = 'xingming'
print(obj)

1.2 DataFrame

data = {'篮球':['詹姆斯','杜兰特'],'足球':['C罗','梅西'],'乒乓球':['马龙','张继科'],
}
df = DataFrame(data)
print(df)
print(data['篮球'])dates = pd.date_range('20200627',periods=5)
print(dates)
df = DataFrame(np.random.rand(5,3),index=dates,columns=['A','B','C'])
print(df)
print(df.loc['2020-06-27':'2020-06-28',['A','B']])
print(df.at['2020-06-29','A'])
print(df.head(2))
print(df.tail(2))

1.3 重新索引,数据运算,数据对齐

s1 = Series([1.1,2.2,3.3],index=['a','b','c'])
s2 = Series([-1.1,-2.2,-3.0,4.4],index=['a','b','c','d'])
s3 = s1+s2
print(s3)d1 = DataFrame(np.arange(9).reshape((3,3)),index=[1,2,3],columns=list('abc'))
d2 = DataFrame(np.arange(12).reshape((4,3)),index=[1,2,3,4],columns=list('cde'))
d3 = d1+d2
print(d3)
d3 = d1.add(d2,fill_value=0)
print(d3)

1.4 Dataframe与series之间的运算与排序

df1 = DataFrame(np.arange(12).reshape((4,3)),columns=list('abc'),index=[1,2,3,4])
s1 = Series(df1.loc[1])
print(df1)
print(s1)
dele = df1-s1 #广播相减
print(dele)s2 = Series(np.arange(3),index=['c','d','e'])
add1 = df1+s2 # 不同索引会合并
print(add1)s2 = Series([3,1,2],index=['c','d','e'])
s1 = s2.sort_values()
print(s1)
s1 = s2.sort_index()
print(s1)df1 = DataFrame(np.arange(8).reshape((2,4)),columns=['d','b','a','c'],index=[2,1])
df2 = df1.sort_index()
print(df2)
df2 = df1.sort_index(axis=1)
print(df2)
df2 = df1.sort_values(by='d')
print(df2)

最后读取文件时比较常用的读取csv文件,这个经常会使用,后续在使用中也有相应的体会。

Python数据处理二相关推荐

  1. python笔记图片_科学网—python数据处理笔记(二)p-v图 - 钱磊的博文

    python数据处理笔记(二)p-v图 已有 9903 次阅读 2012-5-24 17:46 |个人分类:知识|系统分类:科研笔记| Python, 分子云, 常用工具, p-v图 p-v图是分析分 ...

  2. 2021-03-23 python数据处理系统学习(二)控制语句

    2021-03-23 python数据处理系统学习(二)控制语句 1.条件语句(if.else和elif) x=10 if x < 0:print("x小于0") else: ...

  3. python数据处理实例-Python数据处理numpy.median的实例讲解

    numpy模块下的median作用为: 计算沿指定轴的中位数 返回数组元素的中位数 其函数接口为: median(a, axis=None, out=None, overwrite_input=Fal ...

  4. python可以使用二维元组吗_python中读入二维csv格式的表格方法详解(以元组/列表形式表示)...

    怎么去读取一个没有表头的二维csv文件(如下图所示)? 并以元组的形式表现数据: ((1.0, 0.0, 3.0, 180.0), (2.0, 0.0, 2.0, 180.0), (3.0, 0.0, ...

  5. 太赞了!用200道题彻底搞定Python数据处理!

    前言 Pandas与NumPy都是Python数据分析中的利器,但是对着官方文档学习是十分枯燥且低效的方式,因此我精心挑选了200个Python数据处理中的常用操作,并整理成习题的形式创作了Panda ...

  6. python json key_最全总结 | 聊聊 Python 数据处理全家桶(配置篇)

    1.前言 在实际项目中,经常会接触到各种各样的配置文件,它可以增强项目的可维护性 常用配件文件的处理方式,包含:JSON.ini / config.YAML.XML 等 本篇文章,我们将聊聊 Pyth ...

  7. python数据处理实战

    python数据处理实战 二.需求 对杂乱文本数据进行处理 部分数据截图如下,第一个字段是原字段,后面3个是清洗出的字段,从数据库中聚合字段观察,乍一看数据比较规律,类似(币种 金额 万元)这样,我想 ...

  8. python离散积分_科学网—python数据处理笔记(三)通道积分图 - 钱磊的博文

    通道积分是除了p-v图外又一件分析分子云气体运动的利器.在不同的通道查看,可以看到一些速度不同寻常的气体,这些气体就是恒星形成研究中十分感兴趣的高速气体.这些高速气体对于分子云中的能量平衡以及恒星的形 ...

  9. Python数据处理(一):处理 JSON、XML、CSV 三种格式数据

    Python 数据处理系列博客来啦! 本系列将以<Python数据处理>这本书为基础,以书中每章一篇博客的形式带大家一起学习 Python 数据处理.书中有些地方讲的不太详细,我会查阅其他 ...

  10. Python数据处理DataFrame小记

    python数据处理小记 简介: 1.DataFram定义: 2.DataFrame的append 3.DataFrame去除列或行 4.DataFrame查看数据基本统计情况 5.DataFrame ...

最新文章

  1. RxSwift处理Error事件
  2. 浅谈身为小白学习Linux系统的四点实用建议
  3. NavReady的使用
  4. rxjava 并行_使用RxJava和Completable并行执行阻塞任务
  5. 使用less实现自适应宽度
  6. 2020中国奢侈品消费者数字行为洞察报告
  7. 传统到敏捷的转型中,谁更适合做Scrum Master?
  8. 某物流集团企业信息化案例介绍
  9. FAL风控培训|如何用一张图了解所有特征工程的套路
  10. [译] JavaScript 的函数式编程是一种反模式
  11. linux [CTRL]+c与[CTRL]+d
  12. t检验、t分布、t值
  13. 关于ognl.OgnlException: target is null for setProperty(null的解决方案
  14. 1000瓶药水,其中1瓶有毒,最少要几只老鼠?
  15. 用计算机绘制颗粒级配曲线,EXcel如何绘制颗粒级配曲线图
  16. W806/W801/W800多通道ADC同时使用
  17. 神州计算机u盘启动,神州电脑如何使用U盘装系统
  18. [AAM-GCN Neurocomputing2021] Attention adjacency matrix based graph convolutional networks for skele
  19. canvas画线变粗变模糊的解决办法
  20. taro开发微信小程序-播放轨迹(十一)

热门文章

  1. JS—— 常用图片后缀正则校验
  2. 运营日记:App推广手段详解
  3. Rasa课程、Rasa培训、Rasa面试系列之Rasa幕后英雄系列-解决方案工程师Ben Quachtran
  4. Ubuntu18.04+TITAN XP+anaconda+cuda10+cudnn+pytorch
  5. 图的遍历 —— 广度优先遍历
  6. SAP -Posting only Possible in Periods YYYY/MM YYYY/MM in company 1000
  7. 中国风背景素材|2020设计趋势之中国风
  8. 用python爬取企查查_python爬取企查查江苏企业信息生成excel表格
  9. SQL练习题共50道附答案(MySQL
  10. 手机打开电脑html没有图片,jpg图片手机能看电脑打不开怎么办