html提交多个正则表达式,将多个html文件的正则表达式结果写入.txt outfile
我无法将从多个html文件(文本不是英文)获得的正则表达式结果写入.txt文件。它将它们打印成屏幕上新行的几个字符串,但是当我尝试将它写入outfile时,它只会写入一个随机字符串。我的代码看起来像这样: 你能帮我怎么把所有的字符串写入所有大约100个文件的outfile中吗?将多个html文件的正则表达式结果写入.txt outfile
from bs4 import BeautifulSoup
import sys
import string
import re
import os
text = glob.glob('C:/Users/dell/Desktop/python-for-text-analysis-master/Notebooks/MEK/*')
for filename in text:
with open(filename, encoding='ISO-8859-1', errors="ignore") as f:
mytext = f.read()
soup = BeautifulSoup(mytext, "lxml")
extracted_text = soup.getText()
pattern = r"\ba\b\s\bleg[\w]+bb\b\s\b[\w]+\b"
result = (", ".join(re.findall(pattern, mytext)))
file = "C:/Users/dell/Desktop/python-for-text-analysis-master/Data/Charlie/charlie_neww.txt"
for row in result:
with open (file, "w", encoding="iso-8859-1", errors="ignore") as outfile:
print(result, end='\n', file=outfile)
2017-02-09
Lee
+0
我不认为你的意思是'打印(结果)'...... –
2017-02-09 21:46:15
+0
呃,等等......'结果'是一个字符串.....你认为'结果中的行'在做什么?因为我怀疑它在做你认为正在做的事情。 –
2017-02-09 21:47:27
html提交多个正则表达式,将多个html文件的正则表达式结果写入.txt outfile相关推荐
- 万物之始正则表达式全解析三部曲(中篇)-正则表达式运算符优先级及匹配规则
前言 各位小伙伴大家好,接下来几天时间,我会从多个角度对正则表达式进行系统阐述,让你了解正则表达式的前世今生. 该系列文章上篇 万物之始正则表达式全解析三部曲(上篇)-正则表达式基础知识及语法 以下是 ...
- 用正则表达式和java解析csv文件
用正则表达式和java解析csv文件 作者:弹着钢琴设计 来源:博客园 发布时间:2009-06-15 18:31 阅读:337 次 原文链接 [收藏] 在解析csv文件之前,先来看看 ...
- java正则表达式及api_Java魔法堂:深入正则表达式API
目录 一.前言 正则表达式作为文本处理的利器,早已成为各大语言的必要装备,但各语言对其的实现程度(功能语法支持程度)和API设计均有所差异,本篇将目光投向java原生类库中提供的正则表达式API-- ...
- 【Git】Git 版本管理 ( 补充提交版本 git commit --amend | 版本库提取文件 git checkout -- filename | 删除文件 git rm )
文章目录 一.补充提交版本 git commit --amend 二.版本库提取文件 git checkout -- filename 三.删除文件 git rm 一.补充提交版本 git commi ...
- 万物之始正则表达式全解析三部曲(上篇)-正则表达式基础知识及语法
前言 各位小伙伴大家好,接下来几天时间,我会从多个角度对正则表达式进行系统阐述,让你了解正则表达式的前世今生. 以下是博主整理的Linux知识专栏,喜欢的小伙伴可根据自己的需求自行订阅. Linux疑 ...
- java的正则表达式 CPU_小心踩雷!一个小小的正则表达式竟把CPU拖垮......
原标题:小心踩雷!一个小小的正则表达式竟把CPU拖垮...... " 前几天线上一个项目监控信息突然报告异常,上到机器上后查看相关资源的使用情况,发现 CPU 利用率将近 100%. 通过 ...
- .net core 正则表达式 获取 等号后面的值_Python3 正则表达式
Python人工智能 - python 人工智能-神经网络 - 创客学院直播室www.makeru.com.cnPython AI开发实战营 - Day2:Python世界中的封装与异常 - 创客学 ...
- python中的正则表达式是干嘛的_python中正则表达式总结
re.match():从字符串的开始进行匹配 re.search():扫描整个字符串返回第一个匹配 re.findAll():返回所有匹配的字符串 Pattern 对象不能实例化,只能通过compil ...
- vs 正则表达式转大写_liunx之通配符amp;正则表达式
LIUNX之通配符 单引号双引号不加引号区别反引号 ''单引号所见即所得 ""双引号里面的特殊符号会被解析运行 $ LANG $()`` 不加引号和双引号类似支持通配符{} * 通 ...
最新文章
- 特斯拉AI团队招兵买马:“英雄不问出处”
- 一个不错的安全站点yehg.net
- Oracle RMAN Recover中使用BBED 跳过缺失的归档 继续 Recover 的测试
- 政策推动加速5G发展 全球统一标准成大势所趋
- 构建高性能WEB站点笔记三
- 人脸检测(十四)--MTCNN
- [LeetCode] 860. 柠檬水找零 lemonade-change(贪心算法)
- Python中从零开始的简单遗传算法
- 联发科MT6763处理器参数MT6763处理器芯片资料下载
- Word转PDF非常好用的软件——pdfFactory Pro
- Ubuntu下输入金钱符号时只能输入“₵“无法输入“$“
- yolov5 训练结果解析
- 软件测试详解17--接口对接
- php 闭合标记,什么叫自闭合标签?自闭标签有什么用
- openlayers 3扩展,调用百度地图、高德地图、天地图服务
- 服务器作防盗链图片中转,Node.js 上手项目简明教程
- PMP备考指南之第十一章:项目风险管理
- nyoj995硬币找零完全背包
- macbook m1 无法启动mysql服务
- Reaktor 6 for Mac(音乐合成器软件)v6.3.0永久激活版
热门文章
- 连接CPU和计算机的总线,什么是计算机总线 总线和接口的区别
- 下拉多选择框 实现方式_物体检测之旅(三)|设计选择,经验教训和物体检测的趋势...
- java如何获得当前文件路径
- autojsui界面关闭_autojs 第九次 ui界面交互获取
- oracle 安装找不到服务,win7 下安装oracle 11g出现错误: 启动服务出现错误 找不到服务OracleMTSRecoveryService...
- 深度学习之基于Tensorflow2.0实现AlexNet网络
- 数字图像处理之图像基础
- 402. 移掉K位数字(单调栈)
- HFSS怎样在波导中显示多个模式
- 光是无限远服务器有道馆吗,光是无限远服务器客户端