python读取.data文件总结

参考资料

https://www.askpython.com/python/examples/read-data-files-in-python

.data文件格式

.data文件是用来存储数据的一种文件格式。之前通常数据是用逗号隔开或tab健隔开的格式,现在也可能是文本文件格式或二进制文件格式。

识别.data文件里面的数据

1、先测试一下文件是文本文件还是二进制文件

用网上可以下载到的iris.data文件来举例(iris.data文件下载地址:https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data),代码如下:

# 通过python自带的文件读取文本文件
file=open('iris.data','r')
data=file.read()
print(data)
file.close()

运行之后,可以看到结果(此处放部分数据结果):

根据打印出来的数据结果,可以分析出来,iris.data存的是文本数据,并且是用逗号分隔的,也可以认为是csv文件格式。

如果打印出来的数据结果不是文本类型的话,可以测试一下是不是二进制文件,代码如下:

# 通过python自带的文件读取二进制文件
file=open('iris.data','rb')
data=file.read()
print(data)
file.close()

2、用Pandas读取.data文件

方法如下:
用read_csv()方法读取文件,这个方法会自动创建一个dataframe,将数据转换进去,代码如下:

# 使用Pandas读取数据
import pandas as pd
data=pd.read_csv('iris.data',header=None,sep=',')
print(data)

注意:在第一步里面查看文件内容的时候,发现iris.data文件里面没有表头,iris.data的表头是在iris.names文件里面进行说明的(附上iris.names文件下载地址:https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.names),所以在read_csv函数调用的时候,需要加上header=None,否则data里面的第一行就会自动变成表头,这样的话150行数据就变成149行。
运行之后,显示结果如下:

3、其他数据存储类型

除了上述提到的文件格式外,还有json格式和pickle。
在读取的时候,需要import json和import pickle后,调用json.dumps()方法和pickle.dump()方法进行读取。

python读取.data文件总结相关推荐

  1. python读取txt文件并画图

    1,使用python读取txt文件 已知txt文件内容如下: 0 01 12 43 94 165 256 36 请以第一列为x轴,第二列为y轴画图 步骤如下: 1)使用readlines读取文件 2) ...

  2. python怎么读xlsx_用python读取xlsx文件

    一 准备工作: 二 xlrd库读取 首先安装xlrd库,安装方法: pip install xlrd import xlrd #打开excel wb = xlrd.open_workbook('tes ...

  3. python读取.edf文件

    目录 EDF文件简介 MNE-python读取.edf文件 案例 第一步:导入工具包 第二步:加载本地edf文件 第三步:获取原始数据中事件 第四步:根据事件ID获取对应事件 第五步:绘制事件图 本教 ...

  4. python怎么读文件里的某一行-python读取txt文件并取其某一列数据的示例

    菜鸟笔记 首先读取的txt文件如下: AAAAF110 0003E818 0003E1FC 0003E770 0003FFFC 90 AAAAF110 0003E824 0003E208 0003E7 ...

  5. python读取 .mat 文件(matlab文件)

    python读取 .mat 文件(matlab文件)和 scipy库包的使用(4-20181224) 一.python调勇scipy库读取.mat文件 1.使用例子1 2. 使用例子2 二.scipy ...

  6. python打开excel的函数-Python读取excel文件中带公式的值的实现

    在进行excel文件读取的时候,我自己设置了部分直接从公式获取单元格的值 但是用之前的读取方法进行读取的时候,返回值为空 import os import xlrd from xlutils.copy ...

  7. 医学影像中用 python 读取 nrrd 文件、nrrd转nii、nrrd转h5

    用 python 读取 nrrd 文件一般使用 pynrrd 这个库 1 安装pynrrd pip 安装 pip install pynrrd 源码安装 pip install git+https:/ ...

  8. python csv文件复制时的编码问题_使用python读取CSV文件时的编码问题

    尝试使用python读取CSV文件时遇到障碍. 更新:如果只想跳过字符或错误,可以打开文件,如下所示: with open(os.path.join(directory, file), 'r', en ...

  9. python 读取jpg文件是yuv_Python读取YUV文件,并显示的方法

    今天小编就为大家分享一篇Python读取YUV文件,并显示的方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧 Python读取YUV格式文件,并使用opencv显示的方法 open ...

最新文章

  1. 基于微信的图片放大预览
  2. 查看服务器CPU配置信息,转帖-CentOS查看CPU信息、位数、多核信息;查看服务器硬件信息...
  3. c语言中删除有序数组中重复元素,去除有序列表中的重复元素
  4. 高并发高性能服务器是如何实现的
  5. 使用gorilla/mux增强Go HTTP服务器的路由能力
  6. linux 编译 连接失败,编译linux-3.15.5时遇到的几个错误
  7. Spring框架----代理的分析
  8. C语言线性表之双向循环链表
  9. error C2440: 'static_cast' : cannot convert from 'void (__thiscall CMainFrame::* )(void)' to ...
  10. 组合数学-容斥原理-求指定区间内与n互素的数的个数
  11. JQuery之拖拽插件
  12. MYSQL MVCC实现机制
  13. 执行git命令出现 xcrun: error:
  14. 数据库建模工具Pdman
  15. cf两边黑屏怎么解决win10_红警49期:win10玩红警2黑屏但有声音怎么办
  16. 外置存储权限在哪打开_安卓手机外置sd卡权限怎么打开
  17. MT6625平台SP_META软件测试工具下载
  18. 中值定理5-泰勒中值定理
  19. 证券投资基金名词解释
  20. 会议oa之排座和送审

热门文章

  1. Linux内存管理 之 KSM代码实现
  2. 一一数落2006几大“恶心”事件
  3. Windows Installer:正在安装其他程序。请等待该安装完成,然后再次尝试安装此软件
  4. Mina的zkApp
  5. Linux下不保存退出以及相关退出命令
  6. List和IList的区别
  7. android更新软件,Android软件的自动更新
  8. 23-Travel旅游-签证
  9. 输入【ionic start myApp tabs】命令创建项目时失败
  10. python与脚本语言