python读写txt文件

文件的打开的两种方式f = open("data.txt","r")   #设置文件对象
f.close() #关闭文件#为了方便,避免忘记close掉这个文件对象,可以用下面这种方式替代
with open('data.txt',"r") as f:    #设置文件对象str = f.read()    #可以是随便对文件的操作一、读文件1.简单的将文件读取到字符串中f = open("data.txt","r")   #设置文件对象
str = f.read()     #将txt文件的所有内容读入到字符串str中
f.close()   #将文件关闭2.按行读取整个文件#第一种方法
f = open("data.txt","r")   #设置文件对象
line = f.readline()
line = line[:-1]
while line:             #直到读取完文件line = f.readline()  #读取一行文件,包括换行符line = line[:-1]     #去掉换行符,也可以不去
f.close() #关闭文件  #第二种方法
data = []
for line in open("data.txt","r"): #设置文件对象并读取每一行文件data.append(line)               #将每一行文件加入到list中 #第三种方法
f = open("data.txt","r")   #设置文件对象
data = f.readlines()  #直接将文件中按行读到list里,效果与方法2一样
f.close()             #关闭文件3.将文件读入数组中import numpy as np
data = np.loadtxt("data.txt")   #将文件中数据加载到data数组里二、写文件1.简单的将字符串写入txt中with open('data.txt','w') as f:    #设置文件对象f.write(str)                 #将字符串写入文件中2.列表写入文件单层列表data = ['a','b','c']
#单层列表写入文件
with open("data.txt","w") as f:f.writelines(data)双层列表#双层列表写入文件
#第一种方法,每一项用空格隔开,一个列表是一行写入文件
data =[ ['a','b','c'],['a','b','c'],['a','b','c']]
with open("data.txt","w") as f:                                                   #设置文件对象for i in data:                                                                 #对于双层列表中的数据i = str(i).strip('[').strip(']').replace(',','').replace('\'','')+'\n'  #将其中每一个列表规范化成字符串f.write(i)                                                                 #写入文件#第二种方法,直接将每一项都写入文件
data =[ ['a','b','c'],['a','b','c'],['a','b','c']]
with open("data.txt","w") as f:                                                   #设置文件对象for i in data:                                                                 #对于双层列表中的数据f.writelines(i)                                                            #写入文件3.数组写入文件中#将数组写入文件
import numpy as np
#第一种方法
np.savetxt("data.txt",data)     #将数组中数据写入到data.txt文件
#第二种方法
np.save("data.txt",data)        #将数组中数据写入到data.txt文件

Python 文件操作中的读写模式:open(path, ‘-模式-’,encoding=‘UTF-8’)

open(path, ‘-模式-‘,encoding=’UTF-8’)
即open(路径+文件名, 读写模式, 编码)在python对文件进行读写操作的时候,常常涉及到“读写模式”,整理了一下常见的几种模式,如下:读写模式:r :只读
r+ : 读写
w : 新建(会对原有文件进行覆盖)
a : 追加
b : 二进制文件常用的模式有:“a” 以“追加”模式打开, (从 EOF 开始, 必要时创建新文件)
“a+” 以”读写”模式打开
“ab” 以”二进制 追加”模式打开
“ab+” 以”二进制 读写”模式打开“w” 以”写”的方式打开
“w+” 以“读写”模式打开
“wb” 以“二进制 写”模式打开
“wb+” 以“二进制 读写”模式打开“r+” 以”读写”模式打开
“rb” 以”二进制 读”模式打开
“rb+” 以”二进制 读写”模式打开rU 或 Ua 以”读”方式打开, 同时提供通用换行符支持 (PEP 278)需注意:1、使用“w”模式。文件若存在,首先要清空,然后重新创建
2、使用“a”模式。把所有要写入文件的数据都追加到文件的末尾,即使你使用了seek()指向文件的其他地方,如果文件不存在,将自动被创建。3、f.read([size]) :size未指定则返回整个文件,如果文件大小>2倍内存则有问题。f.read()读到文件尾时返回”“(空字串)
4、file.readline() 返回一行
5、file.readline([size]) 返回包含size行的列表,size 未指定则返回全部行
6、”for line in f: print line” #通过迭代器访问
7、f.write(“hello\n”) #如果要写入字符串以外的数据,先将他转换为字符串.
8、f.tell() 返回一个整数,表示当前文件指针的位置(就是到文件头的比特数).
9、f.seek(偏移量,[起始位置]) : 用来移动文件指针
偏移量 : 单位“比特”,可正可负
起始位置 : 0 -文件头, 默认值; 1 -当前位置; 2 -文件尾
10、f.close() 关闭文件

基本的中文文本数据预处理

利用内置方法及re模块保留汉字rere.findall(u'[\u4e00-\u9fff]+', a_str)
保留汉字、换行符rere.findall(u'[\u4e00-\u9fff\n]+', a_str)
list to stringa_str = ' '.join(a_list)
string to lista_list = a_str.split(' ')
删除\替换特定符号a_str_cln = a_str.replace('丨','')rea_str_cln = re.sub('|', ' ', a_str)
确定b中a位置并返回值rere.search(a, b).span()

Python 文件操作中的读写模式:open(path, ‘-模式-‘,encoding=‘UTF-8‘)+python读写文件txt +文本数据预处理相关推荐

  1. python——读取txt文本数据并可视化

    最近用于对比结果,使用到了python的基本操作,之前也有了解但是与M相比难免有些区别 txt文本数据如下 0.9453125 0.9640625 0.671875 0.55625 0.475 0.9 ...

  2. python文本数据处理_从 App 描述介绍文字中发掘 Python 文本数据预处理实例

    本文为 AI 研习社编译的技术博客,原标题 What App Descriptions Tell Us: Text Data Preprocessing in Python,作者为 Finn Qiao ...

  3. python数据预处理的方法_文本数据预处理的方法

    文本数据分析(一):基本框架 在文本数据分析基本框架中,我们涉及到了六个步骤: 数据收集 数据预处理 数据挖掘和可视化 模型构建 模型评估 虽然框架需要迭代,但是我们先将其看作是一个线性的过程: 修正 ...

  4. python爬取京东商品数据要先登录_京东商品评论情感分析|文本数据预处理

    本文爬取了十款热销手机的文本评论数据后,首先对文本评论数据做文本预处理,文本评论数据中存在大量的无价值信息,引入无用的文本数据,对其作情感分析,显然没有价值,得出的文本挖掘结果也不尽人意.所以对于文本 ...

  5. python open encoding=utf-8_Python 文件操作中的读写模式:open(path, '-模式-',encoding='UTF-8')...

    open(path, '-模式-',encoding='UTF-8') 即open(路径+文件名, 读写模式, 编码) 在python对文件进行读写操作的时候,常常涉及到"读写模式" ...

  6. python读取txt文本数据进行分词并生成词云图片

    python对数据分词,生成词云图片 小编在日常生活工作中学习到的点,在此记录一下,希望能够帮助有需要的小伙伴. 文章目录 python对数据分词,生成词云图片 前言 一.全部代码 选用的图片和效果图 ...

  7. Python实现不规则txt文本数据读取并转换为csv文本

    1.需求描述 现在有如下数据文件: id name age 1 小明 13 2 小张 15 3 小王 13 4 张三 14 5 王五 18 需要将上述数据转化为csv文本数据,众所周知,csv是逗号分 ...

  8. Yii 2 修改 URL 模式为 PATH 模式,并隐藏index.php

    美化URL很重要,URL 看起来顺眼,JJ就不疼.废话不多说,两步搞定. 第一:在配置文件加上 urlManager项,看代码: 'urlManager'=>['class' => 'yi ...

  9. plsql导入txt文本数据是乱码_PL/sql导入sql文件中文乱码解决办法

    从别处接过来的pl/SQL导出文件XX.sql文件,用pl/sql工具中的import功能导入到本地库后,发现表的comment注释中文乱码,可通过以下办法解决,特记录如下: 1)进入pl/sql安装 ...

最新文章

  1. 堆、栈、方法区、直接内存
  2. 作者:谢华美(1976-),男,中国人民银行征信中心数据部副总经理,主要研究方向为数据挖掘。...
  3. python 进程池阻塞和非阻塞_python 之 并发编程(进程池与线程池、同步异步阻塞非阻塞、线程queue)...
  4. 2021为什么大家都在选做独立站运营?
  5. string字符串转xml_Java将字符串转换为XML文档和将XML文档转换为String
  6. ESP32WebSocket
  7. 什么是正则表达式 ?
  8. ms vc9 php,php连接sql server数据库库
  9. Struts2(四)
  10. 【保姆级讲解】C语言---指针精华
  11. Cookie加密10
  12. Python零基础学习
  13. fmri|SPM contrast manager
  14. goland编译时提示\go-build\exe\a.out.exe: The process cannot access the file because it is being used
  15. “时间都到哪里去了?”
  16. 【happyz】数字信号处理MATLAB学习-代码整理01
  17. Automatic extrinsic calibration between a camera and a 3D Lidar using 3D point and plane corresponde
  18. 基于微信小程序图书馆座位预约管理系统
  19. i2c-tools调试工具
  20. 个人声明 —— 转战知乎

热门文章

  1. notify_one() 或 notify_all() 在c++中的使用要点
  2. 排序算法之希尔排序(Java)
  3. 前凸后翘的步进电机调速算法~
  4. 案例 github_2019年12月Github上最热门的Java开源项目,速来围观!
  5. Python3——简单的TCP实例
  6. 【Pytorch神经网络实战案例】07 预测泰坦尼克号上生存的乘客
  7. LeetCode 2103. 环和杆(位运算)
  8. LeetCode 1744. 你能在你最喜欢的那天吃到你最喜欢的糖果吗?(前缀和)
  9. LeetCode 527. 单词缩写(Trie树)
  10. 数据结构--队列Queue--链式队列、顺序队列