我需要在处理后将所有文章放入同一文件夹,或者创建一个CSV文件。from bs4 import BeautifulSoup

import glob

import os, os.path

path = '/home/darek/Dokumenty/pliki/'

path_out = '/home/darek/Dokumenty/pliki/nowe'

for filename in glob.glob(os.path.join(path, '*.html',)):

f = filename

tresc = open(f)

soup = BeautifulSoup(tresc, 'html.parser')

article = soup.find('div',class_='post')

tagi = soup.find('div', class_='ph_social_share_box ph_social_share_box_bottom')

fout = open( +filename, "w")

fout.close()

print(article)

我的错误日志:File "/home/darek/Dokumenty/parser.py", line 21, in

fout = open( +filename, "w")

TypeError: bad operand type for unary +: 'str'

这适用于打印。

从bs4导入BeautifulSoup、导入glob、导入os,os.path:path = '/home/darek/Dokumenty/pliki/'

path_out = '/home/darek/Dokumenty/pliki/nowe'

for filename in glob.glob(os.path.join(path, '*.html',)):

f = filename

content = open(f)

soup = BeautifulSoup(content, 'html.parser')

article = soup.find('div',class_='post')

tags = soup.find('div', class_='ph_social_share_box ph_social_share_box_bottom')

print(article)

python中如何保存文件_如何在python中处理后保存文件?相关推荐

  1. python画图修改背景颜色_如何在 Matplotlib 中更改绘图背景的实现

    介绍 Matplotlib是Python中使用最广泛的数据可视化库之一.无论是简单还是复杂的可视化项目,它都是大多数人的首选库. 在本教程中,我们将研究如何在Matplotlib中更改绘图的背景. 导 ...

  2. python保存模型_如何在Python中保存ARIMA时间序列预测模型

    自回归移动平均模型(ARIMA)是一种常用于时间序列分析和预测的线性模型. statsmodels库提供了Python中使用ARIMA的实现.ARIMA模型可以保存到文件中,以便以后对新数据进行预测. ...

  3. python中zipfile的使用_如何在Python中使用ZIPFILE模块压缩文件。

    问题 您要在python中创建一个压缩文件. 介绍 ZIP文件可以保存许多其他文件的压缩内容.压缩文件会减小其在磁盘上的大小,这在通过Internet或使用Control-m AFT或Connect ...

  4. python语言结构化语言_如何在python中处理结构化语言文件

    我有一个像这样的大型结构化语言文件:TASK SchM_Task { TYPE = AUTO; SCHEDULE = NON; PRIORITY = 160; ACTIVATION = 1; TIMI ...

  5. python如何读取uni文件_如何在Python中通过HTTP与UniProt交谈?

    我试图从UniProt获得一些结果,这是一个蛋白质数据库(细节并不重要).我正在尝试使用一种从一种ID转换为另一种ID的脚本.我能够在浏览器上手动执行此操作,但无法在 Python中执行此操作. 在h ...

  6. python输入逗号分隔值文件_如何在Python(Pygame)中显示逗号分隔值(.txt)文件中的前10个高分...

    我正在为我的游戏创建一个高分表.它以下列格式将值附加到.txt文件: 5.234,0,0,5234 6.345,1,1,8345 1.649,0,1,2649 2.25,0,1,3250 ...等等 ...

  7. eval在python中是什么意思_如何在Python中使用eval ?

    Python中的 eval是什么? 在Python中,我们有许多内置方法,这些方法对于使Python成为所有人的便捷语言至关重要,而eval是其中一种.eval函数的语法如下: eval(expres ...

  8. python怎么去掉换行符_如何在Python中删除尾部换行符?

    如何在Python中删除尾部换行符? 什么是Perl的chomp函数的Python等价物,如果它是换行符,它会删除字符串的最后一个字符? 26个解决方案 1473 votes 尝试方法lstrip() ...

  9. python词云自定义形状_如何在Python中生成任何形状的词云

    作者 | Julia Kho 编辑| 代码医生团队 在本文中,我们将探讨如何在python中以您想要的任何形状生成文字云.我们将通过一个示例来说明如何在房屋的自定义形状中创建简单的文字云,如上图所示. ...

  10. python三维图视角旋转_如何在python中旋转3d图? (或作为动画)使用鼠标旋转三维视图...

    我有这段代码,其中包含一个3D图.我在Spyder中运行代码;我想知道是否可以使这个绘图旋转(360度)并保存. 谢谢! P.s.对不起,如果这是一个愚蠢的问题,但我是Python的newby.如何在 ...

最新文章

  1. RepeatMasker安装和使用——基因组重复序列注释
  2. git 移动分支指针_图解4种git合并分支方法
  3. 阿里云centos 6.5 32位安装可视化界面的方法
  4. java保存私钥_如何在Java中使用密钥库来存储私钥?
  5. 2019-11-08 频域的直观感受
  6. linux oracle bad elf,oracle11g安装到red hat6.2 64位系统报错:/lib/ld-linux.so.2: bad ELF interpreter...
  7. 第十二届蓝桥杯A组省赛填空题Java思路及代码合集(相乘直线货物摆放路径回路计数)
  8. 《力学》课时二质点运动学(二)
  9. 部署到gcp_剖析大数据公司为什么选择 GCP?
  10. mysql会对同时读取加锁吗_程序员经典面试题,MySQL并发读写的时候,都是需要加锁的么?...
  11. linux中ifort不识别,pmemd编译安装问题之ifort不识别‘
  12. 三面,字节跳动电商Java面经(已过)
  13. ACM-ICPC2018北京网络赛 Tomb Raider(暴力)
  14. 1941. Scary Martian Word
  15. Win10 删除默认共享文件夹
  16. 通达信破底翻形态选股公式,选出破底之后再翻回的标的
  17. vbnet 直线 弧形在autoCad中的画法
  18. Activity 的生命周期分析
  19. 【答读者问12】如何理解backtrader的line以及对line进行操作?
  20. 关于图像opencv中对于长宽的定义

热门文章

  1. 绝了!这款工具让 Spring Boot 不在需要 Controller、Service、DAO、Mapper 了
  2. 几幅图,拿下 HTTPS
  3. 【开源社区】如何参与JEECG开源团队?
  4. 微信小程序(应用号)调试工具内测破解方法
  5. 七步从AngularJS菜鸟到专家(4和5):指令和表达式
  6. JEECG - 基于代码生成器的J2EE智能开发框架 续一:开发环境搭建步骤
  7. Hadoop数据压缩 与 数据清洗ETL
  8. MySQL GTID复制Slave跳过错误事务Id以及复制排错问题总结
  9. 活动目录的灾难恢复操作指导之三
  10. WordPress 4.8.2 升级维护版本发布