pandas读取文件

本系列教程采用的数据为上证01号股票数据,感谢Tushare金融社区的数据分享

读取csv文件
import pandas as pd
#读取csv文件
fpath="test.csv"
df=pd.read_csv(fpath,encoding='gbk')
#查看前几行
df.head()
编号 操作方式 催化剂总质量(mg) HAP:Co/SiO2 Co/SiO2(wt%) 乙醇浓度(ml/min) 温度 乙醇转化率(%) 乙烯选择性(%) C4烯烃选择性(%) 乙醛选择性(%) 碳数为4-12脂肪醇选择性(%) 甲基苯甲醛和甲基苯甲醇选择性(%) 其他生成物的选择性(%) C4烯烃收率(乙醇转化率*C4烯烃选择性)
0 1 1 400 1.0 1.0 1.68 250 2.07 1.17 34.05 2.41 52.59 0.00 9.78 0.703871
1 1 1 400 1.0 1.0 1.68 275 5.85 1.63 37.43 1.42 53.21 0.00 6.31 2.190299
2 1 1 400 1.0 1.0 1.68 300 14.97 3.02 46.94 4.71 35.16 1.00 9.17 7.026398
3 1 1 400 1.0 1.0 1.68 325 19.68 7.97 49.70 14.69 15.16 2.13 10.35 9.781635
4 1 1 400 1.0 1.0 1.68 350 36.80 12.46 47.21 18.66 9.22 1.69 10.76 17.373760
#查看形状
df.shape
(114, 15)
#查看属性
df.columns
Index(['编号', '操作方式', '催化剂总质量(mg)', 'HAP:Co/SiO2', 'Co/SiO2(wt%)','乙醇浓度(ml/min)', '温度', '乙醇转化率(%)', '乙烯选择性(%)', 'C4烯烃选择性(%)', '乙醛选择性(%)','碳数为4-12脂肪醇选择性(%)', '甲基苯甲醛和甲基苯甲醇选择性(%)', '其他生成物的选择性(%)','C4烯烃收率(乙醇转化率*C4烯烃选择性)'],dtype='object')
#查看索引
df.index
RangeIndex(start=0, stop=114, step=1)
读取txt文件
#当header=None即没有标题时可以手动指定names=
fpath='book.txt'
df=pd.read_csv(fpath,sep="\t",#header=True,#names=['x','y','z'])
df
序号 书名 分类
0 1 HTML5+CSS3+JavaScript从入门到精通(标准版) ...
1 2 JavaWeb项目开发实战入门(全彩版) ...
2 3 案例学WEB前端开发 ...
3 4 一看就停不下来的中国史 ...
4 5 显微镜下的大明 ...
5 ​ ...
读取excel文件
fpath='test.xlsx'
df=pd.read_excel(fpath)
df.head()
编号 操作方式 催化剂总质量(mg) HAP:Co/SiO2 Co/SiO2(wt%) 乙醇浓度(ml/min) 温度 乙醇转化率(%) 乙烯选择性(%) C4烯烃选择性(%) 乙醛选择性(%) 碳数为4-12脂肪醇选择性(%) 甲基苯甲醛和甲基苯甲醇选择性(%) 其他生成物的选择性(%) C4烯烃收率(乙醇转化率*C4烯烃选择性)
0 1 1 400 1.0 1.0 1.68 250 2.067169 1.17 34.05 2.41 52.59 0.00 9.78 0.703871
1 1 1 400 1.0 1.0 1.68 275 5.851721 1.63 37.43 1.42 53.21 0.00 6.31 2.190299
2 1 1 400 1.0 1.0 1.68 300 14.968891 3.02 46.94 4.71 35.16 1.00 9.17 7.026398
3 1 1 400 1.0 1.0 1.68 325 19.681359 7.97 49.70 14.69 15.16 2.13 10.35 9.781635
4 1 1 400 1.0 1.0 1.68 350 36.801017 12.46 47.21 18.66 9.22 1.69 10.76 17.373760
读取mysql表
#此处只给出范例,请连接自己的数据库再使用
import pymssql
#连接信息
con=pymssql.connect(host='127.0.0.1',user='root',password='1234567',database='test',charset='utf-8')
#sql语句+连接信息
df=pd.read_sql("select * from teaches",con=con)
df.head()

panda数据结构

DataFrame:二维数据,整个表格,部分矩表二维表格也是DataFrame

Series:一维数据,行或者列,部分行列也是Series

列表创建series
s1=pd.Series([1,'a',5.2,7],index=['b','c','d','e'])
s1
b      1
c      a
d    5.2
e      7
dtype: object
s1.index
Index(['b', 'c', 'd', 'e'], dtype='object')
字典创建series
#使用字典方式创建,可以使用字典方式访问
dict={'a':1,'b':2,'c':3,'d':4}
s=pd.Series(dict)
s
a    1
b    2
c    3
d    4
dtype: int64
print(s['a'])
print(type(s['a']))
print(s[['a','b']])
print(type(s[['a','b']]))
1
<class 'numpy.int64'>
a    1
b    2
dtype: int64
<class 'pandas.core.series.Series'>
多个字典创建DataFrame
dict={'a':[1,9,1],'b':[2,1,7],'c':[1,2,5],'d':[6,3,0]}
df=pd.DataFrame(dict)
df
a b c d
0 1 2 1 6
1 9 1 2 3
2 1 7 5 0
df.columns
Index(['a', 'b', 'c', 'd'], dtype='object')
df.index
RangeIndex(start=0, stop=3, step=1)
df.dtypes
a    int64
b    int64
c    int64
d    int64
dtype: object
DataFrame中查询Series
#查询单列是Series
df['a']
0    1
1    9
2    1
Name: a, dtype: int64
#查询多列(行)也是DataFrame
df[['a','d']]
a d
0 1 6
1 9 3
2 1 0
#查询一行
df.loc[1]
a    9
b    1
c    2
d    3
Name: 1, dtype: int64
#查询多行
df.loc[1:3]
a b c d
1 9 1 2 3
2 1 7 5 0

源代码和相应数据下载请点击 https://github.com/MiaoChenglin125/Data-Acquisition/tree/master/pandas%E6%93%8D%E4%BD%9C

pandas最快入门(一)-读取与数据结构相关推荐

  1. 用python玩转办公软件(pandas数据分析)入门

    用python玩转办公软件(pandas数据分析)入门 文章目录 用python玩转办公软件(pandas数据分析)入门 1.pandas介绍 2.csv文件介绍 3.pandas常用操作csv (1 ...

  2. 学python人工智能需要多久_人工智能Python开发怎么学才能最快入门

    原标题:人工智能Python开发怎么学才能最快入门 学习 Python 的捷径是什么? 学习Python编程有没有捷径?有,那就是学习过程中牢记三个字--写.背.练 写的意思是把书中所有代码独自写一遍 ...

  3. python怎么学最快-人工智能Python开发怎么学才能最快入门

    原标题:人工智能Python开发怎么学才能最快入门 学习 Python 的捷径是什么? 学习Python编程有没有捷径?有,那就是学习过程中牢记三个字--写.背.练 写的意思是把书中所有代码独自写一遍 ...

  4. 猿创征文 |【算法入门必刷】数据结构-栈(五)

    [算法入门必刷]数据结构-栈(五) 前言 算法入门刷题训练 AB5:点击消除 题目分析 理论准备 题解 小结

  5. OpenCV C++入门,读取和显示一张图片

    文章目录 一.OpenCV C++入门,读取和显示一张图片 二.代码如下 三.类和函数介绍 一.OpenCV C++入门,读取和显示一张图片 OpenCV入门程序,简单显示一张图片. 二.代码如下 # ...

  6. OpenCV 2.图像入门:读取、显示、保存

    OpenCV 中文官方文档:http://woshicver.com/ 图像入门:读取.显示.保存 cv.imread(),cv.imshow(),cv.imwrite() cv.imread()函数 ...

  7. python read_excel 参数_详解pandas库pd.read_excel操作读取excel文件参数整理与实例

    详解pandas库pd.read_excel操作读取excel文件参数整理与实例 来源:中文源码网    浏览: 次    日期:2019年11月5日 详解pandas库pd.read_excel操作 ...

  8. python read_excel header_详解pandas库pd.read_excel操作读取excel文件参数整理与实例

    除了使用xlrd库或者xlwt库进行对excel表格的操作读与写,而且pandas库同样支持excel的操作:且pandas操作更加简介方便. 首先是pd.read_excel的参数:函数为: pd. ...

  9. Redis从入门到精通之底层数据结构快表QuickList详解

    文章目录 0.前言 1. 快表的结构 2. Redis 6.0 快表quicklist 基本结构 2.1 成员变量 2.1 主要操作 2.1 推导结果 3. 快表的操作 3. 快表的优缺点 3.1 优 ...

  10. 两个使用 Pandas 读取异常数据结构 Excel 的方法,拿走不谢!

    作者 | 周萝卜 来源 | 萝卜大杂烩 通常情况下,我们使用 Pandas 来读取 Excel 数据,可以很方便的把数据转化为 DataFrame 类型.但是现实情况往往很骨干,当我们遇到结构不是特别 ...

最新文章

  1. 科大讯飞拟募资36亿,要搞什么大事?
  2. 独家 | 文本数据探索性数据分析结合可视化和NLP产生见解(附代码)
  3. python语言特点有哪些-python的优点和缺点是什么?
  4. ACM入门之【线段树习题】
  5. python0x80070005拒绝访问_PowerShell启用winrm失败:拒绝访问 0x80070005 -2147024891
  6. 小红书:笔试题(棋盘最短路径,笔记本草稿栈,迷宫游戏)
  7. CentOS配置主机名和主机映射
  8. c/c++教程 - 2.4.1 类和对象,封装,class和struct的区别,成员属性设为私有,类拆分成.h.c文件编写方法
  9. c++ 时间戳 转换成时间_区块链世界的公证人:时间戳
  10. 11.30 如何取得当事人的银行账号?
  11. 新华三(H3C)校园招聘技术类笔试题2019
  12. 网络安全攻防实验室通关教程-基础篇
  13. 自适应滤波器之块自适应滤波器
  14. 滑铁卢计算机竞赛福建考点,数学与计算机竞赛界的“四大天王”,你敢来挑战么?...
  15. nest定义路由和路由失效的问题
  16. 虚拟服务器ip怎么配,如何向虚拟服务器分配端口和 IP 地址
  17. Android7.0适配
  18. C/C++ opencv 计算 LBP特征 包括旋转不变 uniform 圆形邻域
  19. vue3 - 【完整源码】超详细实现网站 / H5 在线预览 pdf 文件功能,支持缩放、旋转、全屏预览、打印、下载、内容检索、主题色定制、侧边缩略图、页码跳转等等(最好用的pdf预览器,注释详细!)
  20. 监控广告变现效果,开发者该如何搭建数据分析体系,如何制定优化策略?

热门文章

  1. java怎么读取数据_java怎么读取数据
  2. java线程之读写锁
  3. java基础集合框架——List、Set、Map概述(java集合一)
  4. HTML页面基本结构
  5. 使用python模块 将中文大写汉字转化成阿拉伯数字
  6. matlab 科研绘图
  7. 大学计算机基础与计算思维习题,大学计算机基础与计算思维客观题及答案.doc...
  8. MacBook没声音
  9. 程序设计与数据结构_周立功【读书笔记】
  10. H5禁止苹果手机页面缩放