python读取文件格式化方法
介绍python的一种较为通用的读取文件并进行格式化的方法。
第一种文件格式:
一行数据是一个特征向量,最后一项是标签,表示类别。数据之间用空格分隔。目的是输入这样的文件路径,得到它格式化形成的特征向量和标签向量。
代码
def fileToNumpy(filename):file = open(filename)file_lines = file.readlines()numberOfLines = len(file_lines)dataArray = np.zeros((numberOfLines, 3))labels = []index = 0for line in file_lines:line = line.strip() # 参数为空时,默认删除开头、结尾处空白符(包括'\n', '\r', '\t', ' ')formLine = line.split('\t')dataArray[index,:] = formLine[0:3]labels.append((formLine[-1]))index += 1return dataArray, labelsfilename = "datingTestSet.txt"
dataArray, labels = fileToNumpy(filename)
第二种文件格式类似,但是用逗号分隔
这种文件是csv格式文件,把它当作普通文件来处理。
代码
def fileToNumpy_2(filename):file = open(filename)lines = file.readlines()length = len(lines)data = np.zeros((length, 3))labels = []index = 0for line in lines:line = line.strip()one = line.split(',')data[index,:] = one[0:-1]labels.append(one[-1])index += 1return data, labelsfilename = "testData.txt"
data, labels = fileToNumpy_2(filename)
print(data)
print(labels)
python读取文件格式化方法相关推荐
- python读取文件中的一行
python读取文件 readline()方法,读取一行文件 readlines()方法,读取多行文件,保存到一个列表中 文件内容: filepath = 'test4.txt' handle = o ...
- python读取文件第n行-Python读取文件最后n行的方法
本文实例讲述了Python实现读取文件最后n行的方法.分享给大家供大家参考,具体如下: # -*- coding:utf8-*- import os import time import dateti ...
- python怎么读文件内容-Python读取文件内容为字符串的方法(多种方法详解)
以下笔记是我在 xue.cn 学习群之数据分析小组所整理分享的心得.相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度. 以小见大,下面是2个小技能的具体实战: 如何灵活地处理文 ...
- python numpy读取数据_大神教你python 读取文件并把矩阵转成numpy的两种方法
导读 今天小编就为大家分享一篇python 读取文件并把矩阵转成numpy的两种方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧 在当前目录下: 方法1: file = open( ...
- Python读取文件中汉字方法:导入codecs,添加encoding='utf-8'
通过文件路径读取文件时候,要么用左侧斜杠,要么用两个右侧斜杠 Python读取文件中的汉字方法:导入codecs,添加encoding='utf-8'import codecs a = open('D ...
- python大神读取_大神教你python 读取文件并把矩阵转成numpy的两种方法
导读 今天小编就为大家分享一篇python 读取文件并把矩阵转成numpy的两种方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧 在当前目录下: 方法1: file = open( ...
- python 读取文件到字典读取顺序_Python用list或dict字段模式读取文件的方法
前言 Python用于处理文本数据绝对是个利器,极为简单的读取.分割.过滤.转换支持,使得开发者不需要考虑繁杂的流文件处理过程(相对于JAVA来说的,嘻嘻).博主自己工作中,一些复杂的文本数据处理计算 ...
- Python教程:读取文件有三种方法:(read、readline、readlines)详细用法
python3中,读取文件有三种方法:read().readline().readlines(). 此三种方法,均支持接收一个变量,用于限制每次读取的数据量,但是,通常不会使用. 本文的目的:分析.总 ...
- Python读取文件编码及内容
Python读取文件编码及内容 最近做一个项目,需要读取文件内容,但是文件的编码方式有可能都不一样.有的使用GBK,有的使用UTF8.所以在不正确读取的时候会出现如下错误: UnicodeDecode ...
- python读取文件第n行-python读取文件第n行
广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. pos = pos - 1 try: f.seek(pos, 2) #从 ...
最新文章
- linux网络虚拟化
- Python staticmethod() 函数
- Please select Android SDK
- 吴恩达后,其钦点的百度研究院院长林元庆也离职筹备AI创业
- SpringBoot @Cacheable自定义KeyGenerator
- HDLBits答案(7)_Verilog多路选择器
- 45 张图深度解析 Netty 架构与原理
- 超级计算机操作系统有什么不同,超级计算机功能强大吗?它与普通计算机不同,但也使用Windows系统...
- 洛谷——P1897 电梯里的爱情(两种解法:普通方法、桶排序方法)
- 手机测试相位软件,索尼发布手机用相位检测传感器
- android谷歌服务框架(GoogleServicesFramework)
- springcloudfeign Required request body is missing
- Windows批量装机平台搭建(二)之WDS配置
- (附源码)node.js学生钟点工管理系统 毕业设计 290011
- autojs autoxjs text 选不中 失效 uiselector
- Java网络编程 获取本地主机名称和地址
- 当审稿人给你的意见,你无法修改的时候怎么办哇,真的好绝望?
- andriod——Fresco+Retrofit+GreenDao
- DataEase看中国 - 中国影星“成龙”电影票房数据分析
- 综合设计一个OPPE主页--页面的插件引用(animate.css)--d动画的使用--滚轮或鼠标到该位置时,才有动画的切换---所以我们需要用jquery监听鼠标滚轮的滚动事件
热门文章
- linux mud 游戏,一笑天涯MUD游戏
- 电脑在线时间调整服务器是多少,电脑时间校准服务器
- 登录 Jed_SH ELK 默认端口
- devgis分享 只分享有价值的东西!http://download.csdn.net/user/devgis
- 第一期:一款简单好用的屏幕画笔工具
- php自动发卡程序8.0_「亲测」2020新版个人自动发卡源码 php完整个人发卡网搭建源码...
- selnium 判断页面加载完成_Selenium 的页面加载以及几种等待的问题
- 使用linux批量引物设计,【分享】超实用的引物设计操作,一看就学会
- 【2021 年 MathorCup 高校数学建模挑战赛—赛道A二手车估价问题】2 问题一 数据预处理、特征工程及模型训练Baseline 和数据
- ThinkPad R400 Windows7 驱动安装