python读取.data文件总结
python读取.data文件总结
参考资料
https://www.askpython.com/python/examples/read-data-files-in-python
.data文件格式
.data文件是用来存储数据的一种文件格式。之前通常数据是用逗号隔开或tab健隔开的格式,现在也可能是文本文件格式或二进制文件格式。
识别.data文件里面的数据
1、先测试一下文件是文本文件还是二进制文件
用网上可以下载到的iris.data文件来举例(iris.data文件下载地址:https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data),代码如下:
# 通过python自带的文件读取文本文件
file=open('iris.data','r')
data=file.read()
print(data)
file.close()
运行之后,可以看到结果(此处放部分数据结果):
根据打印出来的数据结果,可以分析出来,iris.data存的是文本数据,并且是用逗号分隔的,也可以认为是csv文件格式。
如果打印出来的数据结果不是文本类型的话,可以测试一下是不是二进制文件,代码如下:
# 通过python自带的文件读取二进制文件
file=open('iris.data','rb')
data=file.read()
print(data)
file.close()
2、用Pandas读取.data文件
方法如下:
用read_csv()方法读取文件,这个方法会自动创建一个dataframe,将数据转换进去,代码如下:
# 使用Pandas读取数据
import pandas as pd
data=pd.read_csv('iris.data',header=None,sep=',')
print(data)
注意:在第一步里面查看文件内容的时候,发现iris.data文件里面没有表头,iris.data的表头是在iris.names文件里面进行说明的(附上iris.names文件下载地址:https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.names),所以在read_csv函数调用的时候,需要加上header=None,否则data里面的第一行就会自动变成表头,这样的话150行数据就变成149行。
运行之后,显示结果如下:
3、其他数据存储类型
除了上述提到的文件格式外,还有json格式和pickle。
在读取的时候,需要import json和import pickle后,调用json.dumps()方法和pickle.dump()方法进行读取。
python读取.data文件总结相关推荐
- python读取txt文件并画图
1,使用python读取txt文件 已知txt文件内容如下: 0 01 12 43 94 165 256 36 请以第一列为x轴,第二列为y轴画图 步骤如下: 1)使用readlines读取文件 2) ...
- python怎么读xlsx_用python读取xlsx文件
一 准备工作: 二 xlrd库读取 首先安装xlrd库,安装方法: pip install xlrd import xlrd #打开excel wb = xlrd.open_workbook('tes ...
- python读取.edf文件
目录 EDF文件简介 MNE-python读取.edf文件 案例 第一步:导入工具包 第二步:加载本地edf文件 第三步:获取原始数据中事件 第四步:根据事件ID获取对应事件 第五步:绘制事件图 本教 ...
- python怎么读文件里的某一行-python读取txt文件并取其某一列数据的示例
菜鸟笔记 首先读取的txt文件如下: AAAAF110 0003E818 0003E1FC 0003E770 0003FFFC 90 AAAAF110 0003E824 0003E208 0003E7 ...
- python读取 .mat 文件(matlab文件)
python读取 .mat 文件(matlab文件)和 scipy库包的使用(4-20181224) 一.python调勇scipy库读取.mat文件 1.使用例子1 2. 使用例子2 二.scipy ...
- python打开excel的函数-Python读取excel文件中带公式的值的实现
在进行excel文件读取的时候,我自己设置了部分直接从公式获取单元格的值 但是用之前的读取方法进行读取的时候,返回值为空 import os import xlrd from xlutils.copy ...
- 医学影像中用 python 读取 nrrd 文件、nrrd转nii、nrrd转h5
用 python 读取 nrrd 文件一般使用 pynrrd 这个库 1 安装pynrrd pip 安装 pip install pynrrd 源码安装 pip install git+https:/ ...
- python csv文件复制时的编码问题_使用python读取CSV文件时的编码问题
尝试使用python读取CSV文件时遇到障碍. 更新:如果只想跳过字符或错误,可以打开文件,如下所示: with open(os.path.join(directory, file), 'r', en ...
- python 读取jpg文件是yuv_Python读取YUV文件,并显示的方法
今天小编就为大家分享一篇Python读取YUV文件,并显示的方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧 Python读取YUV格式文件,并使用opencv显示的方法 open ...
最新文章
- 基于微信的图片放大预览
- 查看服务器CPU配置信息,转帖-CentOS查看CPU信息、位数、多核信息;查看服务器硬件信息...
- c语言中删除有序数组中重复元素,去除有序列表中的重复元素
- 高并发高性能服务器是如何实现的
- 使用gorilla/mux增强Go HTTP服务器的路由能力
- linux 编译 连接失败,编译linux-3.15.5时遇到的几个错误
- Spring框架----代理的分析
- C语言线性表之双向循环链表
- error C2440: 'static_cast' : cannot convert from 'void (__thiscall CMainFrame::* )(void)' to ...
- 组合数学-容斥原理-求指定区间内与n互素的数的个数
- JQuery之拖拽插件
- MYSQL MVCC实现机制
- 执行git命令出现 xcrun: error:
- 数据库建模工具Pdman
- cf两边黑屏怎么解决win10_红警49期:win10玩红警2黑屏但有声音怎么办
- 外置存储权限在哪打开_安卓手机外置sd卡权限怎么打开
- MT6625平台SP_META软件测试工具下载
- 中值定理5-泰勒中值定理
- 证券投资基金名词解释
- 会议oa之排座和送审