一,CSV

逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的的英文逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(注)来开启,再则先另存新档后用EXCEL开启,也是方法之一。

CSV文件格式的通用标准并不存在,但是在RFC 4180中有基础性的描述。的使用字符编码同样没有被指定,但是7位ASCII是最基本的通用编码。

CSV其实就是文本文件,而并不是表格;

csv和.xls的区别在于,.xls的只能用Excel中打开,而且,XLS和CSV的编码格式也不一样,简单来说,CSV可以用文本(TXT)打开也可以用EXCLE打开,而XLS只能用擅长打开

最后,如何在CSV与XLS之间抉择呢?这里我们要弄清楚几个问题,CSV只是单纯的文本文件,同样的,也只是单纯的以文本格式存储,CSV无法生成公式,依赖,也无法保存公式,依赖!所以,如果单纯的只是存储文本格式的数据,可以直接选择使用CSV文件,读写方便,易于实现,数据可以表格化展示,这就是优点!

注意:CSV文件可以通过改变文件后缀名或者通过练成工具强制转换成的的.xls文件,但是要注意乱码问题。

二,CSV文件读和写

1)通过标准的Python中的库导入CSV文件

CSV,用来处理CSV文件。
这个类库中的阅读器()函数用来读入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个numpy的数组,用来训练算法模型。

#!/usr/bin/python3

2)采用numpy的导入CSV文件

可以使用Munpy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型都是一样的。

#!/usr/bin/python3import numpy as np
filename='pima_data.csv'
with open(filename,'rt') as raw_data:data=loadtxt(raw_data,delimiter=',')print(data.shape)

(3)采用Pandas导入CSV文件 - 机器学习项目中常用来做数据清洗与数据准备工作。推荐使用。

使用熊猫来导入文件需要使用pandas.read_csv()函数。这个函数的返回值是数据帧,可以很方便地进行下一步的处理。

#!/usr/bin/python3from pandas import read_csv
filename='iris.data.csv'
names=['separ-length','separ-width','petal-length','petal-width','class']
dataset=read_csv(filename,names=names)
print(dataset.shape)

参考:

https://blog.csdn.net/u012325865/article/details/81670555​blog.csdn.net

csv逗号分隔符转换_机器学习Python实践——数据导入(CSV)相关推荐

  1. 写csv文件_机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  2. python怎么导入csv文件数据-机器学习Python实践——数据导入(CSV)

    一,CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).字幕:纯意味着该文件的英文一个字符序列,不含必须像二进制数 ...

  3. csv逗号分隔符转换_CSV文件存储

    CSV ,全称为 Comma-Separated Values ,中文可以叫逗号分隔值或字符分隔值,其文件以纯文本形式存储表格数据.该文件是一个字符序列,可以由任意数目的记录组成,记录间以某种换行符分 ...

  4. csv逗号分隔符转换_Pandas中处理Csv和Excel数据详解

    作者:Zarten知乎专栏:python数据分析与挖掘深入详解知乎ID: Zarten简介: 互联网一线工作者,尊重原创并欢迎评论留言指出不足之处,也希望多些关注和点赞是给作者最好的鼓励 ! 概述 通 ...

  5. python聚类分析成绩反思_机器学习python实践——二分K-means聚类

    说这算法之前的话,前期的准备工作,请看我前面的博客.上一篇,我说到了K-means聚类算法,但是有很多的不足,有很多能够改进的地方,例如,怎样使得聚类效果达到全局最优(可能的最好结果)呢? 那么接下来 ...

  6. python写入csv指定单元格_使用python将值插入csv中的特定单元格

    我想知道是否有办法用python将数据插入到csv文件的特定单元格中.可以说我有变量"数据",它存储值" 300".如何将这些数据添加到csv文件的第3行第2列 ...

  7. csv逗号分隔符转换_pythonpandas读写csv数据

    官方介绍: pandas的官方手册: https://pandas.pydata.org/pandas-docs/stable/ pandas官方读写数据文档: https://pandas.pyda ...

  8. 机器学习Python实践》——数据导入(CSV)

    一.CSV 逗号分隔值(逗号分隔值,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本).纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样 ...

  9. python第三章上机实践_《机器学习Python实践》读书笔记-第三章

    <机器学习Python实践>,第三章,第一个机器学习项目 以往目录:橘猫吃不胖:<机器学习Python实践>读书笔记-第一章​zhuanlan.zhihu.com 书中介绍了一 ...

最新文章

  1. Web架构师必备能力
  2. [裴礼文数学分析中的典型问题与方法习题参考解答]4.3.20
  3. WinDbg 调试命令记录二 (基础CLR查看)
  4. 大家买PDA干什么,来看SPB的调查
  5. centos 安装jdk_CentOS 7 安装 Oracle JDK 8
  6. react Native 环境安装配置——图解版一目了然
  7. 时钟在微型计算机中作用,微型计算机系统中的实时时钟
  8. TensorFlow tf.feature_column
  9. android之提示Cleartext HTTP traffic to not permitted
  10. 谈谈以前那位研发总监错在哪里
  11. 录音喊话器的故障修理_小鸭圣吉奥滚筒进水后不洗故障维修
  12. c语言中strncpy的用法,C语言中函数strcpy ,strncpy ,strlcpy的用法【转】
  13. 统计学中常被误用的分析方法
  14. 2021年全球陶瓷基板收入大约409.7百万美元,预计2028年达到657.3百万美元
  15. java delphi socket_Delphi跨平台Socket通讯库
  16. DOM事件+正则表达式
  17. iOS总体框架介绍和详尽说明
  18. 我在B站读大学,大数据专业
  19. 微信小程序(上传照片功能、统计字数功能)
  20. OpenCV实践小项目(二) -文档ocr扫描识别

热门文章

  1. 私人linux远程连接,Linux远程连接 - osc_5g1gl9wp的个人空间 - OSCHINA - 中文开源技术交流社区...
  2. android gridview滚动监听,检测GridView滚动速度 – Android
  3. class action extends mysql{_java Action 请求封装(二)
  4. python如何引用txt_python项目依赖库生成requirements.txt文件
  5. SpringBoot中的定时任务的同步与异步
  6. Collections.sort的两种用法
  7. ORACLE:索引中丢失IN或OUT参数
  8. Android开发笔记(七十七)图片缓存算法
  9. centos7 开机启动脚本
  10. keep-alive + vuex + mint + Infinite scroll 保存分页列表数据