《机器学习Python实践》第5章——数据导入
- 1) CSV 文件
- (1)通过标准的Python库导入CSV文件
- (2)采用Numpy 导入CSV文件
- (3)采用Pandas 导入CSV文件——机器学习项目中常用来做数据清洗与数据准备工作。推荐使用。
- 通过标准的Python库导入CSV文件
- 通过NumPy导入CSV文件
- 通过Pandas导入CSV文件
1) CSV 文件
CSV文件使用逗号(,)分隔的文本文件。
在审查CSV文件时,需要注意以下几个方面:
文件头、文件中的注释、分隔符、引号。
(1)通过标准的Python库导入CSV文件
python 提供了一个标准类库CSV,用来处理CSV文件。
这个类库中的reader()函数用来读入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个Numpy数组,用来训练算法模型。
from csv import reader
import numpy as np
filename='pima_data.csv' #这个文件中所有数据都是数字,并且数据中不包含文件头。
with open(filename,'rt') as raw_data:readers = reader(raw_data, delimiter=',')x=list(readers)data=np.array(x).astype('float')print(data.shape)
(2)采用Numpy 导入CSV文件
可以使用Munpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型都是一样的。
import numpy as np
filename='pima_data.csv'
with open(filename,'rt') as raw_data:data=loadtxt(raw_data,delimiter=',')print(data.shape)
(3)采用Pandas 导入CSV文件——机器学习项目中常用来做数据清洗与数据准备工作。推荐使用。
使用Pandas来导入文件需要使用pandas.read_csv()函数。这个函数的返回值是DataFrame,可以很方便地进行下一步的处理。
from pandas import read_csv
filename='iris.data.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)
《机器学习Python实践》第5章——数据导入相关推荐
- python第三章上机实践_《机器学习Python实践》读书笔记-第三章
<机器学习Python实践>,第三章,第一个机器学习项目 以往目录:橘猫吃不胖:<机器学习Python实践>读书笔记-第一章zhuanlan.zhihu.com 书中介绍了一 ...
- 机器学习 Python实践 第一天 18.11.08
本人是某大学大二学生 专业是 软件工程. 由于大一贪玩,大二这学期才有所学习,目前只会C,Python.目前在本学校嵌入式开发实验室.但是我们实验室可以自选喜欢的东西.于是我指向了人工智能.询问了老师 ...
- 使用Python将Excel中的数据导入到MySQL
使用Python将Excel中的数据导入到MySQL 工具 Python 2.7 xlrd MySQLdb 安装 Python 对于不同的系统安装方式不同,Windows平台有exe安装包,Ubunt ...
- python怎么导入sql数据库,##使用python将excel表中数据导入sql server数据库
如何用python将excel数据导入到postgresql数据库中 把excel表格另存为csv文件 python将exce文件含有多个sheet同时l导入sqlserver数据库 需要使用xlrd ...
- python 实战决策树之txt数据导入
首先将txt数据导入 两种方法 第一 将txt 转化为csv 注意 输出路径 不能更改 这能在根目录下 否则会报错 然后再通过np读取到 第二种 直接txt读取 但是 形式不一样 第二种属于元组 n ...
- 机器学习Python实践》——数据导入(CSV)
一.CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样 ...
- 《机器学习Python实践》——数据导入(CSV)
一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...
- 写csv文件_机器学习Python实践——数据导入(CSV)
一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...
- csv逗号分隔符转换_机器学习Python实践——数据导入(CSV)
一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...
- python怎么导入csv文件数据-机器学习Python实践——数据导入(CSV)
一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...
最新文章
- Entity Framework 学习笔记(1)
- JAVA SE学习day_07:异常处理、TCP通信
- python编程入门指南怎么样-如果想学python怎么入门?
- Linux下ssh登录速度慢的解决办法
- Jetty:配置上下文
- 促进新一代人工智能产业发展三年行动计划_工信部新一代人工智能产业创新重点揭榜任务——中国联通智能化网络基础设施及开放平台启动会成功召开...
- Linux优盘挂载卸载以及文件查看
- 一文搞懂物联网Modbus通讯协议
- 使用NGINX作为HTTPS正向代理服务器
- 升级PowerShell至4.0版本
- java文件流下载excel_React获取Java后台文件流下载Excel文件
- Super Saiyan 寻找创业合伙人
- VB2010实例(1)_字符大小写转换
- 计算机用户 图片存储位置,电脑版微信图片存在哪里?存储地址是什么?
- java操作Excel表格使用EasyExcel
- oracle诉讼_Oracle诉Google:Aaaaand诉讼又回来了! [更新]
- 日本武士的简介与起源
- 通过裁切视频画面来改变视频尺寸 ,同时不影响画质
- 空白新机设置——让新电脑nice一些
- KEIL调用Show Disassembly at Adress的方法
热门文章
- c++游戏编程100事列_C/C++编程笔记:C语言开发经典游戏项目《五子棋》,内含源码...
- 阿里云 centos 7.6 安装和启动redis 6
- 计算机二级的注册证件号码,如何在Excel中输入以0开头的证件号码
- adguard自定义_搭建AdGuard Home自定义dns,实现全设备拦截广告的目的
- matlab 自适应波束,(完整word版)自适应波束形成与Matlab程序代码注解
- activiti 工作流_JAVA-工作流引擎-activiti-Tasks-userTask动态绑定用户或用户组
- python微信群定时发送消息_Python3 itchat实现微信定时发送群消息的实例代码
- C# EXCEL 透视表使用 多行多列的导出透视表
- ip查询js获取页面属性
- 贝叶斯球(Bayes ball)