介绍python的一种较为通用的读取文件并进行格式化的方法。

第一种文件格式:

一行数据是一个特征向量,最后一项是标签,表示类别。数据之间用空格分隔。目的是输入这样的文件路径,得到它格式化形成的特征向量和标签向量。

代码

def fileToNumpy(filename):file = open(filename)file_lines = file.readlines()numberOfLines = len(file_lines)dataArray = np.zeros((numberOfLines, 3))labels = []index = 0for line in file_lines:line = line.strip() # 参数为空时,默认删除开头、结尾处空白符(包括'\n', '\r',  '\t',  ' ')formLine = line.split('\t')dataArray[index,:] = formLine[0:3]labels.append((formLine[-1]))index += 1return dataArray, labelsfilename = "datingTestSet.txt"
dataArray, labels = fileToNumpy(filename)

第二种文件格式类似,但是用逗号分隔

这种文件是csv格式文件,把它当作普通文件来处理。

代码

def fileToNumpy_2(filename):file = open(filename)lines = file.readlines()length = len(lines)data = np.zeros((length, 3))labels = []index = 0for line in lines:line = line.strip()one = line.split(',')data[index,:] = one[0:-1]labels.append(one[-1])index += 1return data, labelsfilename = "testData.txt"
data, labels = fileToNumpy_2(filename)
print(data)
print(labels)

python读取文件格式化方法相关推荐

  1. python读取文件中的一行

    python读取文件 readline()方法,读取一行文件 readlines()方法,读取多行文件,保存到一个列表中 文件内容: filepath = 'test4.txt' handle = o ...

  2. python读取文件第n行-Python读取文件最后n行的方法

    本文实例讲述了Python实现读取文件最后n行的方法.分享给大家供大家参考,具体如下: # -*- coding:utf8-*- import os import time import dateti ...

  3. python怎么读文件内容-Python读取文件内容为字符串的方法(多种方法详解)

    以下笔记是我在 xue.cn 学习群之数据分析小组所整理分享的心得.相关背景是:我选择中文词频统计案例作为考察大家python基础功掌握程度. 以小见大,下面是2个小技能的具体实战: 如何灵活地处理文 ...

  4. python numpy读取数据_大神教你python 读取文件并把矩阵转成numpy的两种方法

    导读 今天小编就为大家分享一篇python 读取文件并把矩阵转成numpy的两种方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧 在当前目录下: 方法1: file = open( ...

  5. Python读取文件中汉字方法:导入codecs,添加encoding='utf-8'

    通过文件路径读取文件时候,要么用左侧斜杠,要么用两个右侧斜杠 Python读取文件中的汉字方法:导入codecs,添加encoding='utf-8'import codecs a = open('D ...

  6. python大神读取_大神教你python 读取文件并把矩阵转成numpy的两种方法

    导读 今天小编就为大家分享一篇python 读取文件并把矩阵转成numpy的两种方法,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧 在当前目录下: 方法1: file = open( ...

  7. python 读取文件到字典读取顺序_Python用list或dict字段模式读取文件的方法

    前言 Python用于处理文本数据绝对是个利器,极为简单的读取.分割.过滤.转换支持,使得开发者不需要考虑繁杂的流文件处理过程(相对于JAVA来说的,嘻嘻).博主自己工作中,一些复杂的文本数据处理计算 ...

  8. Python教程:读取文件有三种方法:(read、readline、readlines)详细用法

    python3中,读取文件有三种方法:read().readline().readlines(). 此三种方法,均支持接收一个变量,用于限制每次读取的数据量,但是,通常不会使用. 本文的目的:分析.总 ...

  9. Python读取文件编码及内容

    Python读取文件编码及内容 最近做一个项目,需要读取文件内容,但是文件的编码方式有可能都不一样.有的使用GBK,有的使用UTF8.所以在不正确读取的时候会出现如下错误: UnicodeDecode ...

  10. python读取文件第n行-python读取文件第n行

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. pos = pos - 1 try: f.seek(pos, 2) #从 ...

最新文章

  1. linux网络虚拟化
  2. Python staticmethod() 函数
  3. Please select Android SDK
  4. 吴恩达后,其钦点的百度研究院院长林元庆也离职筹备AI创业
  5. SpringBoot @Cacheable自定义KeyGenerator
  6. HDLBits答案(7)_Verilog多路选择器
  7. 45 张图深度解析 Netty 架构与原理
  8. 超级计算机操作系统有什么不同,超级计算机功能强大吗?它与普通计算机不同,但也使用Windows系统...
  9. 洛谷——P1897 电梯里的爱情(两种解法:普通方法、桶排序方法)
  10. 手机测试相位软件,索尼发布手机用相位检测传感器
  11. android谷歌服务框架(GoogleServicesFramework)
  12. springcloudfeign Required request body is missing
  13. Windows批量装机平台搭建(二)之WDS配置
  14. (附源码)node.js学生钟点工管理系统 毕业设计 290011
  15. autojs autoxjs text 选不中 失效 uiselector
  16. Java网络编程 获取本地主机名称和地址
  17. 当审稿人给你的意见,你无法修改的时候怎么办哇,真的好绝望?
  18. andriod——Fresco+Retrofit+GreenDao
  19. DataEase看中国 - 中国影星“成龙”电影票房数据分析
  20. 综合设计一个OPPE主页--页面的插件引用(animate.css)--d动画的使用--滚轮或鼠标到该位置时,才有动画的切换---所以我们需要用jquery监听鼠标滚轮的滚动事件

热门文章

  1. linux mud 游戏,一笑天涯MUD游戏
  2. 电脑在线时间调整服务器是多少,电脑时间校准服务器
  3. 登录 Jed_SH ELK 默认端口
  4. devgis分享 只分享有价值的东西!http://download.csdn.net/user/devgis
  5. 第一期:一款简单好用的屏幕画笔工具
  6. php自动发卡程序8.0_「亲测」2020新版个人自动发卡源码 php完整个人发卡网搭建源码...
  7. selnium 判断页面加载完成_Selenium 的页面加载以及几种等待的问题
  8. 使用linux批量引物设计,【分享】超实用的引物设计操作,一看就学会
  9. 【2021 年 MathorCup 高校数学建模挑战赛—赛道A二手车估价问题】2 问题一 数据预处理、特征工程及模型训练Baseline 和数据
  10. ThinkPad R400 Windows7 驱动安装