Mr.林:今天我们来学习数据导入,需要使用到Pandas模块。小白:模块?这个是什么东东?

Mr.林:模块相当于是一个文件夹,它能够用于存放同个主题相关的Python代码段,包括定义函数、类和变量。

例如将数据处理相关的函数都存放在一个模块里,将数据分析相关的函数都存放在一个模块里,将数据可视化相关的函数都存放在一个模块里。这样就可以在其他有需要的地方进行调用,在编写程序的时候,经常需要引用其它模块。

你可以将Excel菜单中的每个选项卡 看成是一个模块,例如数据选项卡下就包含了数据获取和转换、连接、排序和筛选、数据工具等功能。只是它以图形界面的方式供我们选择使用。

而Python中的模块一般看不见摸不着,需要在使用的时候进行导入使用,所以对初学者来说不算太友好,这也是大家认为Python难学的原因之一。

另外Python中模块的概念,在 Java 中称之为包(package),而在 C\C++中则称之为库(library),Java和C\C++都是程序员常用的编程语言,所以有些程序员就会把Python 中的模块混淆称之为包和库,你只要明白它们说的是一回事即可。

小白:原来是这么回事,那Pandas模块又是什么?

Mr.林:Pandas模块是Python的一个数据分析模块,它最初被用作金融数据分析工具而开发出来,所以Pandas为时间序列分析提供了很好的支持。
为了提供高效操作大型数据集的工具,Pandas提出了一套类似Excel的标准数据应用框架,包含了类似Excel表格的数据框DataFrame,以及快速便捷地处理数据的函数和方法,让数据分析整个过程变得快速、简单。可以毫不夸张地说,Pandas是Python中进行数据分析的最好工具。

小白:Pandas模块怎么使用呢?它在哪呢?

Mr.林:在安装Anaconda的时候,都已经一起安装好了,我们只需把它导入就可以使用了,主要有两种使用方法:

第一种是使用import语句进行导入。

import 模块名

这是模块导入最常使用的方法,模块导入后,就可以通过使用 模块名.变量名调用模块中的变量,使用 模块名.函数名 调用模块中的函数。

第二种是使用 from import 语句进行导入。

from 模块名 import 函数名

这种情况就是明 确知道要导入哪个模块哪个函数或变量的时候使用。使用这种导入的方式,在使用函 数或变量的时候,就不用在前面加上对应的模块名了。

小白:那我们是不是可以导入Pandas模块了?

Mr.林:可以,不过不用那么急,我们先来看我们要导入的数据data.csv,先使用Notepad++打开查看数据是什么样子的:

这份数据是一份用户数据,记录了用户的id,注册日期reg_date,用户的身份证号id_num,性别gender,生日birthday,年龄age六个字段数据,每个字段使用英文逗号分隔。

还有一个很重要的信息,就是这份数据采用UTF-8的编码格式记录数据。

UTF-8是互联网上使用最广的一种unicode的实现方式,为传输而设计的编码,最大的特点是统一无国界,可以显示全世界上所有文化的字符。

现在我们可以来导入数据了,打开spyder,输入以下代码

1

小白:前三行我大概看懂了,那么第四、五行都是什么意思呀?

Mr.林:我给代码加上对应的注释,使用#来添加注释,这样解析器就不会执行注释所在的行的内容。你再看看。

 1

小白:懂了,懂了,原来是这么回事。

Mr.林:在变量浏览窗口中就可以看到刚导入的data变量了,双击打开data变量,就可以得到下面这张表。

Mr.林:今天就到这,下次我们继续学习数据导入的其他操作,小白你回去要多多练习,多敲代码。

如果你喜欢本文,可以点击右下角在看如果你在跟着学习,请在留言区留言:打卡如果你刚看到本文,可以查看本系列历史文章跟着学习:
跟小白学Python数据分析——Anaconda安装
跟小白学Python数据分析——使用spyder
-----------------长按识别下方二维码,并关注公众号回复“DR”获取案例数据回复“++”获取Notepad++下载地址

csv文件导入 navicat会少了很多记录_跟小白学Python数据分析——数据导入1相关推荐

  1. 三维荧光平行因子学习记录--(一)DOMfluor工具箱的数据导入

    三维荧光平行因子学习记录–(一)DOMfluor工具箱的数据导入 注:本文仅作为自己的学习记录以备以后复习查阅 所有步骤和代码参考知乎上一位大佬在这里po一下他的主页: https://www.zhi ...

  2. logback-spring.xml 文件路径 相对路径_小白学 Python(18):基础文件操作

    人生苦短,我选Python 前文传送门 小白学 Python(1):开篇 小白学 Python(2):基础数据类型(上) 小白学 Python(3):基础数据类型(下) 小白学 Python(4):变 ...

  3. python 相对路径报错_小白学 Python(18):基础文件操作

    人生苦短,我选Python 前文传送门 小白学 Python(1):开篇 小白学 Python(2):基础数据类型(上) 小白学 Python(3):基础数据类型(下) 小白学 Python(4):变 ...

  4. 写csv文件_机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  5. python怎么导入csv文件数据-机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  6. Python:数据导入、爬虫:csv,excel,sql,html,txt

    ''' 来源:天善智能韦玮老师课堂笔记 作者:Dust 数据导入 ·导入csv数据csv是一种常见的数据存储格式,基本上我们遇到的数据都可以转为这种存储格式.在Python数据分析中,我们可以使用pa ...

  7. csv逗号分隔符转换_机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  8. Python生成CSV文件模拟某小区用户手机通话记录

    好消息:"Python小屋"编程比赛正式开始 推荐图书: <Python程序设计(第3版)>,(ISBN:978-7-302-55083-9),董付国,清华大学出版社, ...

  9. python导入sas数据集_运用import过程进行SAS数据导入完全实用教程

    运用import过程进行SAS数据导入完全实用教程 1 单个规范格式文件导入. 对单个文件进行导入是我们遇到最多的情况,主要有以下几种: 1.1 对指定分隔符('|',' ','!','ab'等)数据 ...

  10. python利用自动识别写模块_教你用Python 实现自动导入缺失的库

    在写 Python 项目的时候,我们可能经常会遇到导入模块失败的错误:ImportError: No module named 'xxx' 或者 ModuleNotFoundError: No mod ...

最新文章

  1. 特征选择方法之信息增益
  2. 准备:新V8即将到来,Node.js的性能正在改变
  3. 阿里要未来,百度要利益?
  4. C指针原理(2)-ATT汇编
  5. 微软职位内部推荐-Senior PM
  6. GPU Gems2 - 7 带位移映射的细分表面自适应镶嵌
  7. bash 中的行处理命令 awk
  8. linux expect自动登录ssh,ftp
  9. utilities(C++)——Null类的设计
  10. 中国物联网潜力巨大 还需加快投资节奏
  11. 关于mysql查询_关于mysql的查询
  12. 论文笔记_S2D.39_2015-ICCV-条件随机场作为递归神经网络(CRF-RNN)
  13. 借助winrats软件实现BEKK模型
  14. TCPUDP测试工具 创建UDP通信设置教程
  15. 什么是博客,它与网站有何不同? (说明)
  16. 如何定义用户模型(persona)
  17. 利用Excel批量快速发送电子邮件
  18. QCC3040---读取flash UID
  19. 【数据库原理】函数依赖 平凡依赖 非平凡依赖 完全函数依赖 部分函数依赖 传递函数依赖
  20. 信托购买高搜索产品容易推10元[奥运]门槛

热门文章

  1. 窗体点击,空白处隐藏(stopPropagation)
  2. matlab GUI 设计
  3. [Windows编程] 开发DLL必读《Best Practices for Creating DLLs》
  4. pdf幻灯片:圆锥曲线中的“三定”问题探究(一)
  5. Python学习-生成器
  6. db_cxx.h: No such file or directory
  7. PHP不支持多线程,有时候处理问题不是那么爽,今天谈论一下PHP定时执行的方法...
  8. Intel 45 纳米处理器加速VMware虚拟架构普及
  9. 内核parameter mem解析
  10. android 播放3gp音频,Android的Media(录音,播放音乐,播放视频等)