• 1) CSV 文件

    • (1)通过标准的Python库导入CSV文件
    • (2)采用Numpy 导入CSV文件
    • (3)采用Pandas 导入CSV文件——机器学习项目中常用来做数据清洗与数据准备工作。推荐使用。
  • 通过标准的Python库导入CSV文件
  • 通过NumPy导入CSV文件
  • 通过Pandas导入CSV文件

1) CSV 文件

CSV文件使用逗号(,)分隔的文本文件。
在审查CSV文件时,需要注意以下几个方面:
文件头、文件中的注释、分隔符、引号。

(1)通过标准的Python库导入CSV文件

python 提供了一个标准类库CSV,用来处理CSV文件。
这个类库中的reader()函数用来读入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个Numpy数组,用来训练算法模型。

from csv import reader
import numpy as np
filename='pima_data.csv'      #这个文件中所有数据都是数字,并且数据中不包含文件头。
with open(filename,'rt') as raw_data:readers = reader(raw_data, delimiter=',')x=list(readers)data=np.array(x).astype('float')print(data.shape)

(2)采用Numpy 导入CSV文件

可以使用Munpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型都是一样的。

import numpy as np
filename='pima_data.csv'
with open(filename,'rt') as raw_data:data=loadtxt(raw_data,delimiter=',')print(data.shape)

(3)采用Pandas 导入CSV文件——机器学习项目中常用来做数据清洗与数据准备工作。推荐使用。

使用Pandas来导入文件需要使用pandas.read_csv()函数。这个函数的返回值是DataFrame,可以很方便地进行下一步的处理。

from pandas import read_csv
filename='iris.data.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)

《机器学习Python实践》第5章——数据导入相关推荐

  1. python第三章上机实践_《机器学习Python实践》读书笔记-第三章

    <机器学习Python实践>,第三章,第一个机器学习项目 以往目录:橘猫吃不胖:<机器学习Python实践>读书笔记-第一章​zhuanlan.zhihu.com 书中介绍了一 ...

  2. 机器学习 Python实践 第一天 18.11.08

    本人是某大学大二学生 专业是 软件工程. 由于大一贪玩,大二这学期才有所学习,目前只会C,Python.目前在本学校嵌入式开发实验室.但是我们实验室可以自选喜欢的东西.于是我指向了人工智能.询问了老师 ...

  3. 使用Python将Excel中的数据导入到MySQL

    使用Python将Excel中的数据导入到MySQL 工具 Python 2.7 xlrd MySQLdb 安装 Python 对于不同的系统安装方式不同,Windows平台有exe安装包,Ubunt ...

  4. python怎么导入sql数据库,##使用python将excel表中数据导入sql server数据库

    如何用python将excel数据导入到postgresql数据库中 把excel表格另存为csv文件 python将exce文件含有多个sheet同时l导入sqlserver数据库 需要使用xlrd ...

  5. python 实战决策树之txt数据导入

    首先将txt数据导入 两种方法 第一 将txt 转化为csv 注意 输出路径 不能更改 这能在根目录下 否则会报错 然后再通过np读取到 第二种  直接txt读取 但是 形式不一样 第二种属于元组 n ...

  6. 机器学习Python实践》——数据导入(CSV)

    一.CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样 ...

  7. 《机器学习Python实践》——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  8. 写csv文件_机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  9. csv逗号分隔符转换_机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  10. python怎么导入csv文件数据-机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

最新文章

  1. Entity Framework 学习笔记(1)
  2. JAVA SE学习day_07:异常处理、TCP通信
  3. python编程入门指南怎么样-如果想学python怎么入门?
  4. Linux下ssh登录速度慢的解决办法
  5. Jetty:配置上下文
  6. 促进新一代人工智能产业发展三年行动计划_工信部新一代人工智能产业创新重点揭榜任务——中国联通智能化网络基础设施及开放平台启动会成功召开...
  7. Linux优盘挂载卸载以及文件查看
  8. 一文搞懂物联网Modbus通讯协议
  9. 使用NGINX作为HTTPS正向代理服务器
  10. 升级PowerShell至4.0版本
  11. java文件流下载excel_React获取Java后台文件流下载Excel文件
  12. Super Saiyan 寻找创业合伙人
  13. VB2010实例(1)_字符大小写转换
  14. 计算机用户 图片存储位置,电脑版微信图片存在哪里?存储地址是什么?
  15. java操作Excel表格使用EasyExcel
  16. oracle诉讼_Oracle诉Google:Aaaaand诉讼又回来了! [更新]
  17. 日本武士的简介与起源
  18. 通过裁切视频画面来改变视频尺寸 ,同时不影响画质
  19. 空白新机设置——让新电脑nice一些
  20. KEIL调用Show Disassembly at Adress的方法

热门文章

  1. c++游戏编程100事列_C/C++编程笔记:C语言开发经典游戏项目《五子棋》,内含源码...
  2. 阿里云 centos 7.6 安装和启动redis 6
  3. 计算机二级的注册证件号码,如何在Excel中输入以0开头的证件号码
  4. adguard自定义_搭建AdGuard Home自定义dns,实现全设备拦截广告的目的
  5. matlab 自适应波束,(完整word版)自适应波束形成与Matlab程序代码注解
  6. activiti 工作流_JAVA-工作流引擎-activiti-Tasks-userTask动态绑定用户或用户组
  7. python微信群定时发送消息_Python3 itchat实现微信定时发送群消息的实例代码
  8. C# EXCEL 透视表使用 多行多列的导出透视表
  9. ip查询js获取页面属性
  10. 贝叶斯球(Bayes ball)