我无法将从多个html文件(文本不是英文)获得的正则表达式结果写入.txt文件。它将它们打印成屏幕上新行的几个字符串,但是当我尝试将它写入outfile时,它只会写入一个随机字符串。我的代码看起来像这样: 你能帮我怎么把所有的字符串写入所有大约100个文件的outfile中吗?将多个html文件的正则表达式结果写入.txt outfile

from bs4 import BeautifulSoup

import sys

import string

import re

import os

text = glob.glob('C:/Users/dell/Desktop/python-for-text-analysis-master/Notebooks/MEK/*')

for filename in text:

with open(filename, encoding='ISO-8859-1', errors="ignore") as f:

mytext = f.read()

soup = BeautifulSoup(mytext, "lxml")

extracted_text = soup.getText()

pattern = r"\ba\b\s\bleg[\w]+bb\b\s\b[\w]+\b"

result = (", ".join(re.findall(pattern, mytext)))

file = "C:/Users/dell/Desktop/python-for-text-analysis-master/Data/Charlie/charlie_neww.txt"

for row in result:

with open (file, "w", encoding="iso-8859-1", errors="ignore") as outfile:

print(result, end='\n', file=outfile)

2017-02-09

Lee

+0

我不认为你的意思是'打印(结果)'...... –

2017-02-09 21:46:15

+0

呃,等等......'结果'是一个字符串.....你认为'结果中的行'在做什么?因为我怀疑它在做你认为正在做的事情。 –

2017-02-09 21:47:27

html提交多个正则表达式,将多个html文件的正则表达式结果写入.txt outfile相关推荐

  1. 万物之始正则表达式全解析三部曲(中篇)-正则表达式运算符优先级及匹配规则

    前言 各位小伙伴大家好,接下来几天时间,我会从多个角度对正则表达式进行系统阐述,让你了解正则表达式的前世今生. 该系列文章上篇 万物之始正则表达式全解析三部曲(上篇)-正则表达式基础知识及语法 以下是 ...

  2. 用正则表达式和java解析csv文件

    用正则表达式和java解析csv文件 作者:弹着钢琴设计  来源:博客园  发布时间:2009-06-15 18:31  阅读:337 次  原文链接   [收藏]   在解析csv文件之前,先来看看 ...

  3. java正则表达式及api_Java魔法堂:深入正则表达式API

    目录 一.前言 正则表达式作为文本处理的利器,早已成为各大语言的必要装备,但各语言对其的实现程度(功能语法支持程度)和API设计均有所差异,本篇将目光投向java原生类库中提供的正则表达式API--  ...

  4. 【Git】Git 版本管理 ( 补充提交版本 git commit --amend | 版本库提取文件 git checkout -- filename | 删除文件 git rm )

    文章目录 一.补充提交版本 git commit --amend 二.版本库提取文件 git checkout -- filename 三.删除文件 git rm 一.补充提交版本 git commi ...

  5. 万物之始正则表达式全解析三部曲(上篇)-正则表达式基础知识及语法

    前言 各位小伙伴大家好,接下来几天时间,我会从多个角度对正则表达式进行系统阐述,让你了解正则表达式的前世今生. 以下是博主整理的Linux知识专栏,喜欢的小伙伴可根据自己的需求自行订阅. Linux疑 ...

  6. java的正则表达式 CPU_小心踩雷!一个小小的正则表达式竟把CPU拖垮......

    原标题:小心踩雷!一个小小的正则表达式竟把CPU拖垮...... " 前几天线上一个项目监控信息突然报告异常,上到机器上后查看相关资源的使用情况,发现 CPU 利用率将近 100%. 通过 ...

  7. .net core 正则表达式 获取 等号后面的值_Python3 正则表达式

    Python人工智能 - python 人工智能-神经网络 - 创客学院直播室​www.makeru.com.cnPython AI开发实战营 - Day2:Python世界中的封装与异常 - 创客学 ...

  8. python中的正则表达式是干嘛的_python中正则表达式总结

    re.match():从字符串的开始进行匹配 re.search():扫描整个字符串返回第一个匹配 re.findAll():返回所有匹配的字符串 Pattern 对象不能实例化,只能通过compil ...

  9. vs 正则表达式转大写_liunx之通配符amp;正则表达式

    LIUNX之通配符 单引号双引号不加引号区别反引号 ''单引号所见即所得 ""双引号里面的特殊符号会被解析运行 $ LANG $()`` 不加引号和双引号类似支持通配符{} * 通 ...

最新文章

  1. 特斯拉AI团队招兵买马:“英雄不问出处”
  2. 一个不错的安全站点yehg.net
  3. Oracle RMAN Recover中使用BBED 跳过缺失的归档 继续 Recover 的测试
  4. 政策推动加速5G发展 全球统一标准成大势所趋
  5. 构建高性能WEB站点笔记三
  6. 人脸检测(十四)--MTCNN
  7. [LeetCode] 860. 柠檬水找零 lemonade-change(贪心算法)
  8. Python中从零开始的简单遗传算法
  9. 联发科MT6763处理器参数MT6763处理器芯片资料下载
  10. Word转PDF非常好用的软件——pdfFactory Pro
  11. Ubuntu下输入金钱符号时只能输入“₵“无法输入“$“
  12. yolov5 训练结果解析
  13. 软件测试详解17--接口对接
  14. php 闭合标记,什么叫自闭合标签?自闭标签有什么用
  15. openlayers 3扩展,调用百度地图、高德地图、天地图服务
  16. 服务器作防盗链图片中转,Node.js 上手项目简明教程
  17. PMP备考指南之第十一章:项目风险管理
  18. nyoj995硬币找零完全背包
  19. macbook m1 无法启动mysql服务
  20. Reaktor 6 for Mac(音乐合成器软件)v6.3.0永久激活版

热门文章

  1. 连接CPU和计算机的总线,什么是计算机总线 总线和接口的区别
  2. 下拉多选择框 实现方式_物体检测之旅(三)|设计选择,经验教训和物体检测的趋势...
  3. java如何获得当前文件路径
  4. autojsui界面关闭_autojs 第九次 ui界面交互获取
  5. oracle 安装找不到服务,win7 下安装oracle 11g出现错误: 启动服务出现错误 找不到服务OracleMTSRecoveryService...
  6. 深度学习之基于Tensorflow2.0实现AlexNet网络
  7. 数字图像处理之图像基础
  8. 402. 移掉K位数字(单调栈)
  9. HFSS怎样在波导中显示多个模式
  10. 光是无限远服务器有道馆吗,光是无限远服务器客户端