如下所示:

# -*- coding: utf-8 -*-

# @ author hulei 2016-5-3

from numpy import *

import operator

from os import listdir

import sys

reload(sys)

sys.setdefaultencoding('utf8')

# x,y=getDataSet_dz('iris.data.txt',4)

def getDataSet(filename,numberOfFeature): #将数据集读入内存

fr = open(filename)

numberOfLines = len(fr.readlines()) #get the number of lines in the file file.readlines()是把文件的全部内容读到内存,并解析成一个list

returnMat = zeros((numberOfLines,numberOfFeature)) #prepare matrix to return 3代表数据集中特征数目###

classLabelVector = [] #prepare labels return

fr = open(filename)

index = 0

for line in fr.readlines():

line = line.strip() #strip() 参数为空时,默认删除空白符(包括'\n', '\r', '\t', ' ')

listFromLine = line.split(',') #split 以什么为标准分割一次 分成数组中的每个元素

returnMat[index,:] = listFromLine[0:numberOfFeature]

#classLabelVector.append(int(listFromLine[-1])) #append() 方法向列表的尾部添加一个新的元素

if listFromLine[-1] == 'Iris-setosa' :

classLabelVector.append(1)

elif listFromLine[-1] == 'Iris-versicolor' :

classLabelVector.append(2)

else:

#elif listFromLine[-1] == 'Iris-virginica' :

classLabelVector.append(3)

index += 1

return returnMat,classLabelVector

def getDataSet_dz(filename,numberOfFeature): #改进版,可以消除数据中的空白行

numberOfLines = 0

mx = [] #将数据集 去除空行后存入

fr = open(filename)

for line in fr.readlines():

line = line.strip()

if line != '' : #去除空白行

numberOfLines+=1

mx.append( line.split(',') )

returnMat = zeros((numberOfLines,numberOfFeature))

classLabelVector = []

for index in range(numberOfLines) :

returnMat[index,:] = mx[index][0:numberOfFeature]

if mx[index][-1] == 'Iris-setosa' :

classLabelVector.append(1)

elif mx[index][-1] == 'Iris-versicolor' :

classLabelVector.append(2)

else:

#elif listFromLine[-1] == 'Iris-virginica' :

classLabelVector.append(3)

return returnMat,classLabelVector

以上这篇Python读取数据集并消除数据中的空行方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

本文标题: Python读取数据集并消除数据中的空行方法

本文地址: http://www.cppcns.com/jiaoben/python/234384.html

python读取数据集前十行_Python读取数据集并消除数据中的空行方法相关推荐

  1. python读取数据集的方法_Python读取数据集并消除数据中的空行方法

    如下所示: # -*- coding: utf-8 -*- # @ author hulei 2016-5-3 from numpy import * import operator from os ...

  2. python读取word指定内容_python读取word 中指定位置的表格及表格数据

    1.Word文档如下: 2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specT ...

  3. python excel写入一列_python读取excel指定列数据并写入到新的excel方法

    如下所示: #encoding=utf-8 import xlrd from xlwt import * #------------------读数据------------------------- ...

  4. python csv数据处理生成图_Python 读取CSV文件数据并生成可视化图形

    CSV 文件数据读取并生成图形 CSV 文件格式 在文本文件中存储数据,最简单的方式就是将数据按照一定的格式存放在文件中,在读取文件时根据设计好的格式去将对应数据读取出来,这样就能很方便的进行简单数据 ...

  5. python读excel并写入_Python读取Excel文件并写入数据库

    好方法最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在做自动化测试的时候,如果涉及到数据的读取和存储,那么而 ...

  6. python读取xml文件内容_python读取xml文件

    关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python来读取xml文件. 什么是xm ...

  7. python如何读取文件指定行_Python读取文件、大文件和指定行内容的几种方法

    在使用python处理文本的时候,经常会需要读取文件的内容.如果文件比较小,那么直接使用open文件对象打开文件,再通过read()方法最为方便,这种方法就是把文件内容读出来后放到内存变量. read ...

  8. python读取配置文件失败原因_python读取配置文件报keyerror-文件路径不正确导致的错误...

    - 在其他模块使用反射读取配置文件报错,但是在反射模块中读取GetData.check_list又是正确的 反射模块如下: # get_data.py from API_AUTO.p2p_projec ...

  9. python输出字体的大小_Python之美——一只数据狗的笔记[长期更新]

    两年前咬咬牙跳了Matlab的坑,入手了Python,从此一发不可收的成了PY的重度依赖者.本人研究工作皆涉及大量的数据处理工作,PY和R作为数据分析的两驾马车,得其一者得天下.另外,我接触的许多软件 ...

最新文章

  1. 超详细中文预训练模型ERNIE使用指南
  2. mysql棋牌管理_棋牌架构DB服务(Mysql+Redis)数据存储演进笔记
  3. debian安装emacs23
  4. Unity3d DLL脚本通用解密方法
  5. mysql binlog限流问题总结
  6. spring-第十二篇之两种后处理器
  7. 云计算分布式架构简介
  8. 有什么软件可以提升视频画质,将模糊视频修复清晰?
  9. win7专业版设置通电自启动
  10. 多种方法在Markdown加入上划线、中划线、下划线
  11. alertmanager配置详解
  12. 漫画:什么是架构师?
  13. Latex 公式被压扁过小
  14. 一文读懂MySQL常用语法
  15. 201SC@SDUSC-SUDDOC-blog08
  16. Tkinter 组件详解(十八):PanedWindow
  17. 搭建umi框架时出现Error: Error: Plugin umi-plugin-react can't be resolved
  18. 加密解密数字证书相关知识
  19. 校园兼职网站php设计,大学生兼职网站的设计开发毕业论文.doc
  20. 【HMS Core】AOSP11安装/预置HMS Core 可以关闭限制广告跟踪吗?

热门文章

  1. java 监测文件夹_实时监测文件夹中新增的文件和文件夹(java)
  2. MySQL中varchar类型字段隐式转换造成多删除数据
  3. mysql ---- DQL(单表查询)
  4. android java调用c_Android JNI简单实例(android 调用C/C++代码)
  5. oracle ocr掉盘,恢复OCR磁盘组一则
  6. csv导入mysql phpmyadmin_关于mysql:使用phpMyAdmin导入大型csv文件
  7. spring-kafka、kafka-client 和springboot的版本对应关系
  8. Android开发笔记(六十九)JNI实战
  9. 栈的应用 - 就近匹配
  10. LVS--NAT模型