import os # 首先在Python中载入os库,为设置工作路径做准备

os.getcwd() # get current working directory 查看当前工作路径

os.chdir("D:Python Learningpandas-videos-masterdata") # change directory 更改工作路径

os.getcwd() # 此时可以看到工作路径已经被更改,让我们开始操作吧!

import pandas as pd # 载入pandas库,并简记为pd

orders = pd.read_csv("chipotle.tsv", sep = "t") # 输入工作路径下的文件名称,并输入该文件中使用的分隔符,read_csv函数默认的分隔符是逗号(comma),而tsv是以tab为分隔符的表格文件,因此需要设置sep参数。

orders.head() # 查看orders数据集的前五行。head方法(method)可以查看一个数据集的前若干行,默认的行数为5。pandas库中还有一个tail方法可以查看最后若干行,和head方法时对应的。

movie_user = pd.read_csv(r"u.user", sep = "|") # 我们再来看一个关于影院用户的数据集

movie_user.head() # 查看movie_user数据集的前五行,结果如下所示:

我们可以看到表头出了点问题。在导入数据时,我们可以设置header参数来解决。

movie_user = pd.read_csv(r"u.user", sep = "|", header = None) # header的缺省值为0,即表格文件中的第1行内容作为表头。当header参数被设置为None时,该数据集的表头就为Python默认的0、1、2、3、4......

movie_user.head() # 查看movie_user数据集的前五行,结果如下所示:

如果我们想设置表头(columns),我们可以用两种办法来实现:

(1)在导入数据的时候设置names参数

col_names = ["user_id","age","gender","occupation","zip_code"]

movie_user = pd.read_csv(r"u.user", sep = "|", header=None, names = col_names)

(2)在导入以后再设置columns属性(attribute)

movie_user = pd.read_csv(r"u.user", sep = "|", header=None)

movie_user.columns = ["user_id","age","gender","occupation","zip_code"]

两种办法的效果是完全一致的,如下所示:

python 提取前五行_Pandas 1:如何在Python中载入数据集相关推荐

  1. 如何在Photoshop中载入使用pat格式的文件?ps图案pat格式文件载入教程

    PS中有一种为"pat"后缀的ps图案模式,小编今天为大家带来了如何在Photoshop中载入使用pat格式的文件?ps图案pat格式文件载入教程,有需要的小伙伴快来看看吧! 在桌 ...

  2. 如何在WorkNC中载入机床?

    如何在WorkNC中载入机床? 如何在WorkNC中放置机床? WorKNC的坐标系建立方式 直接选中坐标系-点击"应用为加工坐标系"会重算所有的程序,并且所有的程序都会用选中的坐 ...

  3. python提取前几行数据_python读取文件的前几行

    文件内容rolling.txt: There's a fire starting in my heart 我怒火中烧 Reaching a fever pitch and it's bringing ...

  4. 用python画奔驰的标志_如何在CATIA中快速画一个奔驰车标

    原标题:如何在CATIA中快速画一个奔驰车标 咱们这个公众号呀,总是发一些二次开发啊,代码啊什么的,这观众看的啊,是云里雾里的!哎,内位说了:您能不能讲点儿我们听的懂的内容啊?那好,今儿咱们就来说说, ...

  5. python 参数个数 同名函数_如何在python中编写不同参数的同名方法

    我在Java背景下学习Python(3.x). 我有一个python程序,我在其中创建一个personObject并将其添加到列表中.p = Person("John") list ...

  6. python实现随机抽取答题_如何在python中实现随机选择

    这篇文章主要介绍了如何在python中实现随机选择,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 想从一个序列中随机抽取若干元素,或者想生成几个随机 ...

  7. python 正则表达式 前瞻_我应该如何在python中编写这个正则表达式(How should I write this regex in python)...

    我应该如何在python中编写这个正则表达式(How should I write this regex in python) 我有字符串. st = "12345 hai how r u ...

  8. python如何读取uni文件_如何在Python中通过HTTP与UniProt交谈?

    我试图从UniProt获得一些结果,这是一个蛋白质数据库(细节并不重要).我正在尝试使用一种从一种ID转换为另一种ID的脚本.我能够在浏览器上手动执行此操作,但无法在 Python中执行此操作. 在h ...

  9. python画图修改背景颜色_如何在 Matplotlib 中更改绘图背景的实现

    介绍 Matplotlib是Python中使用最广泛的数据可视化库之一.无论是简单还是复杂的可视化项目,它都是大多数人的首选库. 在本教程中,我们将研究如何在Matplotlib中更改绘图的背景. 导 ...

最新文章

  1. 【搜索专题】DFS之连通性模型与搜索顺序
  2. 深度分享:世界顶级计算语言学科学家Ken Church CCL 2018主旨报告(附PPT全文)
  3. html 消息通知功能,HTML5之消息通知的使用(Web Notification)
  4. TCP连接过程:三次握手与四次握手—Vecloud微云
  5. unity 中让Text的文字动态刷新形式
  6. php数组foreach循环添加键值对_在PHP的foreach循环中插入一个$key作为变量
  7. CLR Via CSharp读书笔记(7):常量和字段
  8. qt widget 窗口句柄的问题
  9. delphi 第三方组件 log4cpp.dll
  10. 对天气数据进行简单的数据分析
  11. centos7安装redies
  12. 表格中计算机设置,如何在excel表格中设置下拉菜单?一招教你搞定!
  13. 【信道估计】LS/MMSE信道估计,CS信道估计的MATLAB仿真
  14. 内核网络数据结构-SKB
  15. 星际争霸 虚空之遗 人族5BB 操作流程
  16. 如何运用SCQA发现问题?
  17. JavaScript 入门哪本书最好?(问、答) 《转载》
  18. R语言ggplot2可视化:使用ggpubr包的text_grob函数和as_ggplot函数可视化文本段落(将指定文本段落可视化出来、指定文本段可视化为图像)
  19. Cytoskeleton Rho/Rac/Cdc42 激活剂 I
  20. 开发者眼中的“道、法、术、器”

热门文章

  1. 微信支付 - 提供支付中心商户订单查询
  2. Lambda表达式练习1【应用】
  3. threadpoolexecutor底层实现原理
  4. Azkaban-solo模式-安装
  5. MapReduce-Combiner规约-原理分析
  6. SpringBoot_入门-HelloWorld细节-场景启动器(starter)
  7. spring事务管理-概念部分
  8. DelayQueue源码
  9. PyTorch深度学习实践02
  10. linux编译安装mysql5.1.x