pandas最快入门(一)-读取与数据结构
pandas读取文件
本系列教程采用的数据为上证01号股票数据,感谢Tushare金融社区的数据分享
读取csv文件
import pandas as pd
#读取csv文件
fpath="test.csv"
df=pd.read_csv(fpath,encoding='gbk')
#查看前几行
df.head()
编号 | 操作方式 | 催化剂总质量(mg) | HAP:Co/SiO2 | Co/SiO2(wt%) | 乙醇浓度(ml/min) | 温度 | 乙醇转化率(%) | 乙烯选择性(%) | C4烯烃选择性(%) | 乙醛选择性(%) | 碳数为4-12脂肪醇选择性(%) | 甲基苯甲醛和甲基苯甲醇选择性(%) | 其他生成物的选择性(%) | C4烯烃收率(乙醇转化率*C4烯烃选择性) | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 250 | 2.07 | 1.17 | 34.05 | 2.41 | 52.59 | 0.00 | 9.78 | 0.703871 |
1 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 275 | 5.85 | 1.63 | 37.43 | 1.42 | 53.21 | 0.00 | 6.31 | 2.190299 |
2 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 300 | 14.97 | 3.02 | 46.94 | 4.71 | 35.16 | 1.00 | 9.17 | 7.026398 |
3 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 325 | 19.68 | 7.97 | 49.70 | 14.69 | 15.16 | 2.13 | 10.35 | 9.781635 |
4 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 350 | 36.80 | 12.46 | 47.21 | 18.66 | 9.22 | 1.69 | 10.76 | 17.373760 |
#查看形状
df.shape
(114, 15)
#查看属性
df.columns
Index(['编号', '操作方式', '催化剂总质量(mg)', 'HAP:Co/SiO2', 'Co/SiO2(wt%)','乙醇浓度(ml/min)', '温度', '乙醇转化率(%)', '乙烯选择性(%)', 'C4烯烃选择性(%)', '乙醛选择性(%)','碳数为4-12脂肪醇选择性(%)', '甲基苯甲醛和甲基苯甲醇选择性(%)', '其他生成物的选择性(%)','C4烯烃收率(乙醇转化率*C4烯烃选择性)'],dtype='object')
#查看索引
df.index
RangeIndex(start=0, stop=114, step=1)
读取txt文件
#当header=None即没有标题时可以手动指定names=
fpath='book.txt'
df=pd.read_csv(fpath,sep="\t",#header=True,#names=['x','y','z'])
df
序号 书名 分类 | |
---|---|
0 | 1 HTML5+CSS3+JavaScript从入门到精通(标准版) ... |
1 | 2 JavaWeb项目开发实战入门(全彩版) ... |
2 | 3 案例学WEB前端开发 ... |
3 | 4 一看就停不下来的中国史 ... |
4 | 5 显微镜下的大明 ... |
5 | ... |
读取excel文件
fpath='test.xlsx'
df=pd.read_excel(fpath)
df.head()
编号 | 操作方式 | 催化剂总质量(mg) | HAP:Co/SiO2 | Co/SiO2(wt%) | 乙醇浓度(ml/min) | 温度 | 乙醇转化率(%) | 乙烯选择性(%) | C4烯烃选择性(%) | 乙醛选择性(%) | 碳数为4-12脂肪醇选择性(%) | 甲基苯甲醛和甲基苯甲醇选择性(%) | 其他生成物的选择性(%) | C4烯烃收率(乙醇转化率*C4烯烃选择性) | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 250 | 2.067169 | 1.17 | 34.05 | 2.41 | 52.59 | 0.00 | 9.78 | 0.703871 |
1 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 275 | 5.851721 | 1.63 | 37.43 | 1.42 | 53.21 | 0.00 | 6.31 | 2.190299 |
2 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 300 | 14.968891 | 3.02 | 46.94 | 4.71 | 35.16 | 1.00 | 9.17 | 7.026398 |
3 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 325 | 19.681359 | 7.97 | 49.70 | 14.69 | 15.16 | 2.13 | 10.35 | 9.781635 |
4 | 1 | 1 | 400 | 1.0 | 1.0 | 1.68 | 350 | 36.801017 | 12.46 | 47.21 | 18.66 | 9.22 | 1.69 | 10.76 | 17.373760 |
读取mysql表
#此处只给出范例,请连接自己的数据库再使用
import pymssql
#连接信息
con=pymssql.connect(host='127.0.0.1',user='root',password='1234567',database='test',charset='utf-8')
#sql语句+连接信息
df=pd.read_sql("select * from teaches",con=con)
df.head()
panda数据结构
DataFrame:二维数据,整个表格,部分矩表二维表格也是DataFrame
Series:一维数据,行或者列,部分行列也是Series
列表创建series
s1=pd.Series([1,'a',5.2,7],index=['b','c','d','e'])
s1
b 1
c a
d 5.2
e 7
dtype: object
s1.index
Index(['b', 'c', 'd', 'e'], dtype='object')
字典创建series
#使用字典方式创建,可以使用字典方式访问
dict={'a':1,'b':2,'c':3,'d':4}
s=pd.Series(dict)
s
a 1
b 2
c 3
d 4
dtype: int64
print(s['a'])
print(type(s['a']))
print(s[['a','b']])
print(type(s[['a','b']]))
1
<class 'numpy.int64'>
a 1
b 2
dtype: int64
<class 'pandas.core.series.Series'>
多个字典创建DataFrame
dict={'a':[1,9,1],'b':[2,1,7],'c':[1,2,5],'d':[6,3,0]}
df=pd.DataFrame(dict)
df
a | b | c | d | |
---|---|---|---|---|
0 | 1 | 2 | 1 | 6 |
1 | 9 | 1 | 2 | 3 |
2 | 1 | 7 | 5 | 0 |
df.columns
Index(['a', 'b', 'c', 'd'], dtype='object')
df.index
RangeIndex(start=0, stop=3, step=1)
df.dtypes
a int64
b int64
c int64
d int64
dtype: object
DataFrame中查询Series
#查询单列是Series
df['a']
0 1
1 9
2 1
Name: a, dtype: int64
#查询多列(行)也是DataFrame
df[['a','d']]
a | d | |
---|---|---|
0 | 1 | 6 |
1 | 9 | 3 |
2 | 1 | 0 |
#查询一行
df.loc[1]
a 9
b 1
c 2
d 3
Name: 1, dtype: int64
#查询多行
df.loc[1:3]
a | b | c | d | |
---|---|---|---|---|
1 | 9 | 1 | 2 | 3 |
2 | 1 | 7 | 5 | 0 |
源代码和相应数据下载请点击 https://github.com/MiaoChenglin125/Data-Acquisition/tree/master/pandas%E6%93%8D%E4%BD%9C
pandas最快入门(一)-读取与数据结构相关推荐
- 用python玩转办公软件(pandas数据分析)入门
用python玩转办公软件(pandas数据分析)入门 文章目录 用python玩转办公软件(pandas数据分析)入门 1.pandas介绍 2.csv文件介绍 3.pandas常用操作csv (1 ...
- 学python人工智能需要多久_人工智能Python开发怎么学才能最快入门
原标题:人工智能Python开发怎么学才能最快入门 学习 Python 的捷径是什么? 学习Python编程有没有捷径?有,那就是学习过程中牢记三个字--写.背.练 写的意思是把书中所有代码独自写一遍 ...
- python怎么学最快-人工智能Python开发怎么学才能最快入门
原标题:人工智能Python开发怎么学才能最快入门 学习 Python 的捷径是什么? 学习Python编程有没有捷径?有,那就是学习过程中牢记三个字--写.背.练 写的意思是把书中所有代码独自写一遍 ...
- 猿创征文 |【算法入门必刷】数据结构-栈(五)
[算法入门必刷]数据结构-栈(五) 前言 算法入门刷题训练 AB5:点击消除 题目分析 理论准备 题解 小结
- OpenCV C++入门,读取和显示一张图片
文章目录 一.OpenCV C++入门,读取和显示一张图片 二.代码如下 三.类和函数介绍 一.OpenCV C++入门,读取和显示一张图片 OpenCV入门程序,简单显示一张图片. 二.代码如下 # ...
- OpenCV 2.图像入门:读取、显示、保存
OpenCV 中文官方文档:http://woshicver.com/ 图像入门:读取.显示.保存 cv.imread(),cv.imshow(),cv.imwrite() cv.imread()函数 ...
- python read_excel 参数_详解pandas库pd.read_excel操作读取excel文件参数整理与实例
详解pandas库pd.read_excel操作读取excel文件参数整理与实例 来源:中文源码网 浏览: 次 日期:2019年11月5日 详解pandas库pd.read_excel操作 ...
- python read_excel header_详解pandas库pd.read_excel操作读取excel文件参数整理与实例
除了使用xlrd库或者xlwt库进行对excel表格的操作读与写,而且pandas库同样支持excel的操作:且pandas操作更加简介方便. 首先是pd.read_excel的参数:函数为: pd. ...
- Redis从入门到精通之底层数据结构快表QuickList详解
文章目录 0.前言 1. 快表的结构 2. Redis 6.0 快表quicklist 基本结构 2.1 成员变量 2.1 主要操作 2.1 推导结果 3. 快表的操作 3. 快表的优缺点 3.1 优 ...
- 两个使用 Pandas 读取异常数据结构 Excel 的方法,拿走不谢!
作者 | 周萝卜 来源 | 萝卜大杂烩 通常情况下,我们使用 Pandas 来读取 Excel 数据,可以很方便的把数据转化为 DataFrame 类型.但是现实情况往往很骨干,当我们遇到结构不是特别 ...
最新文章
- 科大讯飞拟募资36亿,要搞什么大事?
- 独家 | 文本数据探索性数据分析结合可视化和NLP产生见解(附代码)
- python语言特点有哪些-python的优点和缺点是什么?
- ACM入门之【线段树习题】
- python0x80070005拒绝访问_PowerShell启用winrm失败:拒绝访问 0x80070005 -2147024891
- 小红书:笔试题(棋盘最短路径,笔记本草稿栈,迷宫游戏)
- CentOS配置主机名和主机映射
- c/c++教程 - 2.4.1 类和对象,封装,class和struct的区别,成员属性设为私有,类拆分成.h.c文件编写方法
- c++ 时间戳 转换成时间_区块链世界的公证人:时间戳
- 11.30 如何取得当事人的银行账号?
- 新华三(H3C)校园招聘技术类笔试题2019
- 网络安全攻防实验室通关教程-基础篇
- 自适应滤波器之块自适应滤波器
- 滑铁卢计算机竞赛福建考点,数学与计算机竞赛界的“四大天王”,你敢来挑战么?...
- nest定义路由和路由失效的问题
- 虚拟服务器ip怎么配,如何向虚拟服务器分配端口和 IP 地址
- Android7.0适配
- C/C++ opencv 计算 LBP特征 包括旋转不变 uniform 圆形邻域
- vue3 - 【完整源码】超详细实现网站 / H5 在线预览 pdf 文件功能,支持缩放、旋转、全屏预览、打印、下载、内容检索、主题色定制、侧边缩略图、页码跳转等等(最好用的pdf预览器,注释详细!)
- 监控广告变现效果,开发者该如何搭建数据分析体系,如何制定优化策略?