Python数据处理二
前两天我的笔记本电脑出问题了,拿到联想3C服务区修,耽搁了一些时间,然后用手机写了一些内容,今天把前几天学习的内容给补上。
今天首先是简单记录一下自己学习的pandas。同样的,练习的代码放到我的GitHub上:https://github.com/noDreamNoLife/hugay
1. pandas
1.1 series
首先series它可以看成一个类似数组的结构,它其实是一组数据和其索引组成的一种结构,一组简单的数据就可以是一个series结构。
# Series
obj = Series([1, 2, 3, 4, 5])
print(obj)
print(obj.index)
print(obj.values)# 自定义索引
obj = Series([1, 2, 3, 4, 5], index=(1, 2, 3, 4, 5))
print(obj)# series还可以看成字典的形式
data = {'a': 1, 'b': 2, 'c': 3}
obj = Series(data)
print(obj)
keys = ['a','c']
obj_1 = Series(data,index=keys)
print(obj_1)# series中简单的缺失值判断与处理
data = {'a':None,'b': 2, 'c': 3}
obj = Series(data)
print(pd.isnull(obj))
print((obj.isnull()))# 自定义索引名
data = {'xiaohu':None,'xiaodai': 2, 'xiaowang': 3}
obj = Series(data)
obj.name = 'xingminghemingzi'
obj.index.name = 'xingming'
print(obj)
1.2 DataFrame
data = {'篮球':['詹姆斯','杜兰特'],'足球':['C罗','梅西'],'乒乓球':['马龙','张继科'],
}
df = DataFrame(data)
print(df)
print(data['篮球'])dates = pd.date_range('20200627',periods=5)
print(dates)
df = DataFrame(np.random.rand(5,3),index=dates,columns=['A','B','C'])
print(df)
print(df.loc['2020-06-27':'2020-06-28',['A','B']])
print(df.at['2020-06-29','A'])
print(df.head(2))
print(df.tail(2))
1.3 重新索引,数据运算,数据对齐
s1 = Series([1.1,2.2,3.3],index=['a','b','c'])
s2 = Series([-1.1,-2.2,-3.0,4.4],index=['a','b','c','d'])
s3 = s1+s2
print(s3)d1 = DataFrame(np.arange(9).reshape((3,3)),index=[1,2,3],columns=list('abc'))
d2 = DataFrame(np.arange(12).reshape((4,3)),index=[1,2,3,4],columns=list('cde'))
d3 = d1+d2
print(d3)
d3 = d1.add(d2,fill_value=0)
print(d3)
1.4 Dataframe与series之间的运算与排序
df1 = DataFrame(np.arange(12).reshape((4,3)),columns=list('abc'),index=[1,2,3,4])
s1 = Series(df1.loc[1])
print(df1)
print(s1)
dele = df1-s1 #广播相减
print(dele)s2 = Series(np.arange(3),index=['c','d','e'])
add1 = df1+s2 # 不同索引会合并
print(add1)s2 = Series([3,1,2],index=['c','d','e'])
s1 = s2.sort_values()
print(s1)
s1 = s2.sort_index()
print(s1)df1 = DataFrame(np.arange(8).reshape((2,4)),columns=['d','b','a','c'],index=[2,1])
df2 = df1.sort_index()
print(df2)
df2 = df1.sort_index(axis=1)
print(df2)
df2 = df1.sort_values(by='d')
print(df2)
最后读取文件时比较常用的读取csv文件,这个经常会使用,后续在使用中也有相应的体会。
Python数据处理二相关推荐
- python笔记图片_科学网—python数据处理笔记(二)p-v图 - 钱磊的博文
python数据处理笔记(二)p-v图 已有 9903 次阅读 2012-5-24 17:46 |个人分类:知识|系统分类:科研笔记| Python, 分子云, 常用工具, p-v图 p-v图是分析分 ...
- 2021-03-23 python数据处理系统学习(二)控制语句
2021-03-23 python数据处理系统学习(二)控制语句 1.条件语句(if.else和elif) x=10 if x < 0:print("x小于0") else: ...
- python数据处理实例-Python数据处理numpy.median的实例讲解
numpy模块下的median作用为: 计算沿指定轴的中位数 返回数组元素的中位数 其函数接口为: median(a, axis=None, out=None, overwrite_input=Fal ...
- python可以使用二维元组吗_python中读入二维csv格式的表格方法详解(以元组/列表形式表示)...
怎么去读取一个没有表头的二维csv文件(如下图所示)? 并以元组的形式表现数据: ((1.0, 0.0, 3.0, 180.0), (2.0, 0.0, 2.0, 180.0), (3.0, 0.0, ...
- 太赞了!用200道题彻底搞定Python数据处理!
前言 Pandas与NumPy都是Python数据分析中的利器,但是对着官方文档学习是十分枯燥且低效的方式,因此我精心挑选了200个Python数据处理中的常用操作,并整理成习题的形式创作了Panda ...
- python json key_最全总结 | 聊聊 Python 数据处理全家桶(配置篇)
1.前言 在实际项目中,经常会接触到各种各样的配置文件,它可以增强项目的可维护性 常用配件文件的处理方式,包含:JSON.ini / config.YAML.XML 等 本篇文章,我们将聊聊 Pyth ...
- python数据处理实战
python数据处理实战 二.需求 对杂乱文本数据进行处理 部分数据截图如下,第一个字段是原字段,后面3个是清洗出的字段,从数据库中聚合字段观察,乍一看数据比较规律,类似(币种 金额 万元)这样,我想 ...
- python离散积分_科学网—python数据处理笔记(三)通道积分图 - 钱磊的博文
通道积分是除了p-v图外又一件分析分子云气体运动的利器.在不同的通道查看,可以看到一些速度不同寻常的气体,这些气体就是恒星形成研究中十分感兴趣的高速气体.这些高速气体对于分子云中的能量平衡以及恒星的形 ...
- Python数据处理(一):处理 JSON、XML、CSV 三种格式数据
Python 数据处理系列博客来啦! 本系列将以<Python数据处理>这本书为基础,以书中每章一篇博客的形式带大家一起学习 Python 数据处理.书中有些地方讲的不太详细,我会查阅其他 ...
- Python数据处理DataFrame小记
python数据处理小记 简介: 1.DataFram定义: 2.DataFrame的append 3.DataFrame去除列或行 4.DataFrame查看数据基本统计情况 5.DataFrame ...
最新文章
- RxSwift处理Error事件
- 浅谈身为小白学习Linux系统的四点实用建议
- NavReady的使用
- rxjava 并行_使用RxJava和Completable并行执行阻塞任务
- 使用less实现自适应宽度
- 2020中国奢侈品消费者数字行为洞察报告
- 传统到敏捷的转型中,谁更适合做Scrum Master?
- 某物流集团企业信息化案例介绍
- FAL风控培训|如何用一张图了解所有特征工程的套路
- [译] JavaScript 的函数式编程是一种反模式
- linux [CTRL]+c与[CTRL]+d
- t检验、t分布、t值
- 关于ognl.OgnlException: target is null for setProperty(null的解决方案
- 1000瓶药水,其中1瓶有毒,最少要几只老鼠?
- 用计算机绘制颗粒级配曲线,EXcel如何绘制颗粒级配曲线图
- W806/W801/W800多通道ADC同时使用
- 神州计算机u盘启动,神州电脑如何使用U盘装系统
- [AAM-GCN Neurocomputing2021] Attention adjacency matrix based graph convolutional networks for skele
- canvas画线变粗变模糊的解决办法
- taro开发微信小程序-播放轨迹(十一)
热门文章
- JS—— 常用图片后缀正则校验
- 运营日记:App推广手段详解
- Rasa课程、Rasa培训、Rasa面试系列之Rasa幕后英雄系列-解决方案工程师Ben Quachtran
- Ubuntu18.04+TITAN XP+anaconda+cuda10+cudnn+pytorch
- 图的遍历 —— 广度优先遍历
- SAP -Posting only Possible in Periods YYYY/MM YYYY/MM in company 1000
- 中国风背景素材|2020设计趋势之中国风
- 用python爬取企查查_python爬取企查查江苏企业信息生成excel表格
- SQL练习题共50道附答案(MySQL
- 手机打开电脑html没有图片,jpg图片手机能看电脑打不开怎么办