python 提取前五行_Pandas 1:如何在Python中载入数据集
import os # 首先在Python中载入os库,为设置工作路径做准备
os.getcwd() # get current working directory 查看当前工作路径
os.chdir("D:Python Learningpandas-videos-masterdata") # change directory 更改工作路径
os.getcwd() # 此时可以看到工作路径已经被更改,让我们开始操作吧!
import pandas as pd # 载入pandas库,并简记为pd
orders = pd.read_csv("chipotle.tsv", sep = "t") # 输入工作路径下的文件名称,并输入该文件中使用的分隔符,read_csv函数默认的分隔符是逗号(comma),而tsv是以tab为分隔符的表格文件,因此需要设置sep参数。
orders.head() # 查看orders数据集的前五行。head方法(method)可以查看一个数据集的前若干行,默认的行数为5。pandas库中还有一个tail方法可以查看最后若干行,和head方法时对应的。
movie_user = pd.read_csv(r"u.user", sep = "|") # 我们再来看一个关于影院用户的数据集
movie_user.head() # 查看movie_user数据集的前五行,结果如下所示:
我们可以看到表头出了点问题。在导入数据时,我们可以设置header参数来解决。
movie_user = pd.read_csv(r"u.user", sep = "|", header = None) # header的缺省值为0,即表格文件中的第1行内容作为表头。当header参数被设置为None时,该数据集的表头就为Python默认的0、1、2、3、4......
movie_user.head() # 查看movie_user数据集的前五行,结果如下所示:
如果我们想设置表头(columns),我们可以用两种办法来实现:
(1)在导入数据的时候设置names参数
col_names = ["user_id","age","gender","occupation","zip_code"]
movie_user = pd.read_csv(r"u.user", sep = "|", header=None, names = col_names)
(2)在导入以后再设置columns属性(attribute)
movie_user = pd.read_csv(r"u.user", sep = "|", header=None)
movie_user.columns = ["user_id","age","gender","occupation","zip_code"]
两种办法的效果是完全一致的,如下所示:
python 提取前五行_Pandas 1:如何在Python中载入数据集相关推荐
- 如何在Photoshop中载入使用pat格式的文件?ps图案pat格式文件载入教程
PS中有一种为"pat"后缀的ps图案模式,小编今天为大家带来了如何在Photoshop中载入使用pat格式的文件?ps图案pat格式文件载入教程,有需要的小伙伴快来看看吧! 在桌 ...
- 如何在WorkNC中载入机床?
如何在WorkNC中载入机床? 如何在WorkNC中放置机床? WorKNC的坐标系建立方式 直接选中坐标系-点击"应用为加工坐标系"会重算所有的程序,并且所有的程序都会用选中的坐 ...
- python提取前几行数据_python读取文件的前几行
文件内容rolling.txt: There's a fire starting in my heart 我怒火中烧 Reaching a fever pitch and it's bringing ...
- 用python画奔驰的标志_如何在CATIA中快速画一个奔驰车标
原标题:如何在CATIA中快速画一个奔驰车标 咱们这个公众号呀,总是发一些二次开发啊,代码啊什么的,这观众看的啊,是云里雾里的!哎,内位说了:您能不能讲点儿我们听的懂的内容啊?那好,今儿咱们就来说说, ...
- python 参数个数 同名函数_如何在python中编写不同参数的同名方法
我在Java背景下学习Python(3.x). 我有一个python程序,我在其中创建一个personObject并将其添加到列表中.p = Person("John") list ...
- python实现随机抽取答题_如何在python中实现随机选择
这篇文章主要介绍了如何在python中实现随机选择,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 想从一个序列中随机抽取若干元素,或者想生成几个随机 ...
- python 正则表达式 前瞻_我应该如何在python中编写这个正则表达式(How should I write this regex in python)...
我应该如何在python中编写这个正则表达式(How should I write this regex in python) 我有字符串. st = "12345 hai how r u ...
- python如何读取uni文件_如何在Python中通过HTTP与UniProt交谈?
我试图从UniProt获得一些结果,这是一个蛋白质数据库(细节并不重要).我正在尝试使用一种从一种ID转换为另一种ID的脚本.我能够在浏览器上手动执行此操作,但无法在 Python中执行此操作. 在h ...
- python画图修改背景颜色_如何在 Matplotlib 中更改绘图背景的实现
介绍 Matplotlib是Python中使用最广泛的数据可视化库之一.无论是简单还是复杂的可视化项目,它都是大多数人的首选库. 在本教程中,我们将研究如何在Matplotlib中更改绘图的背景. 导 ...
最新文章
- 【搜索专题】DFS之连通性模型与搜索顺序
- 深度分享:世界顶级计算语言学科学家Ken Church CCL 2018主旨报告(附PPT全文)
- html 消息通知功能,HTML5之消息通知的使用(Web Notification)
- TCP连接过程:三次握手与四次握手—Vecloud微云
- unity 中让Text的文字动态刷新形式
- php数组foreach循环添加键值对_在PHP的foreach循环中插入一个$key作为变量
- CLR Via CSharp读书笔记(7):常量和字段
- qt widget 窗口句柄的问题
- delphi 第三方组件 log4cpp.dll
- 对天气数据进行简单的数据分析
- centos7安装redies
- 表格中计算机设置,如何在excel表格中设置下拉菜单?一招教你搞定!
- 【信道估计】LS/MMSE信道估计,CS信道估计的MATLAB仿真
- 内核网络数据结构-SKB
- 星际争霸 虚空之遗 人族5BB 操作流程
- 如何运用SCQA发现问题?
- JavaScript 入门哪本书最好?(问、答) 《转载》
- R语言ggplot2可视化:使用ggpubr包的text_grob函数和as_ggplot函数可视化文本段落(将指定文本段落可视化出来、指定文本段可视化为图像)
- Cytoskeleton Rho/Rac/Cdc42 激活剂 I
- 开发者眼中的“道、法、术、器”