爬取 meiriyiwen.com每日一文随机文章保存到程序的相同目录下的 article.txt 文件中

import requests
from lxml import etree
import time
import osdef getArticle(url):headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'}# get 请求r = requests.get(url, headers=headers)# 提取数据html = etree.HTML(r.text)article = html.xpath('//h1/text() | //p[@class="article_author"]/span/text() | //div[@class="article_text"]/p/text()')# 追加的方式写到文本文件中with open('article.txt', 'a+', encoding='utf-8') as f:f.write(time.ctime() + '\n\n《' + article[0] + '》' + '\n\n作者:' + article[1] + '\n\n')f.write('\n'.join(article[2:]))f.write('\n\n')url = 'https://meiriyiwen.com'
try:mark = int(input('今日文章--输入0\n''随机文章--输入篇数(最高100)\n'))if mark is 0:print('今日文章')getArticle(url)print('OK')else:print('随机文章')# 这里设置最高爬取一百篇随机文章for i in range(min(mark, 100)):getArticle(url + '/random')time.sleep(1)print('第' + str(i + 1) + '篇OK')
except ValueError:print('请输入数字')os.system('pause')

python爬取每日一文meiriyiwen.com相关推荐

  1. python爬取知网论文信息

    用Python爬取指望关于某个主题的所有论文摘要等信息. 很幸运的找到了一个大佬的代码来自己改改改! 先放大佬代码连接 Git 接下来就是我自己嚯嚯嚯改的,很小白的了... 应该是很详细得了 为了看懂 ...

  2. Python 爬取每日北上资金数据

    北上资金一直被誉为"聪明钱",擅长左侧交易.现在很多机构和大户都会盯着北上资金调整自己的交易.这似乎已经是公开的秘密了.香港证券交易python教程所每天收盘都会公布当天北上资金的 ...

  3. python爬取知网论文关键词_Python爬虫根据关键词爬取知网论文摘要并保存到数据库中【入门必学】...

    搜索出来的结果和知网上的结果几乎一样,另外以后面试找Python工作,项目经验展示是核心,如果你缺项目练习,去小编的Python交流.裙 :一久武其而而流一思(数字的谐音)转换下可以找到了,里面很多新 ...

  4. python爬取文件归类_python爬取各类文档方法归类汇总

    HTML文档是互联网上的主要文档类型,但还存在如TXT.WORD.excel.PDF.csv等多种类型的文档.网络爬虫不仅需要能够抓取HTML中的敏感信息,也需要有抓取其他类型文档的能力.下面简要记录 ...

  5. 爬取每日必应图片,python爬虫简单入门

    爬取每日必应图片: 网址:微软必应搜索 第一步,打开网站: 右键,查看网页源代码: 初看有点吓人,不过幸运的是图片地址就在开头几行显眼的位置 ![在这里插入图片描述](https://img-blog ...

  6. Python爬取起点小说并写入文档

    python爬取起点免费小说 按F12查看网页源代码: 发现每一章小说链接在li中,这时可以提取每一章的链接: def get_html(url):r=requests.get(url)html=Be ...

  7. python爬取气象台每日天气图代码

    特别鸣谢以下更多python教程请到友情连接: 菜鸟教程https://www.piaodoo.com 初中毕业读什么技校 http://cntkd.net 茂名一技http://www.enechn ...

  8. [Python] 爬取 材料力学Ⅰ第六版刘鸿文-指导与例题习题解答

    [Python] 爬取 材料力学Ⅰ第六版刘鸿文-指导与例题习题解答 下载 书<材料力学Ⅰ 第六版刘鸿文-指导与例题习题解答>的全部图片 下载的图片保存在./cailiaolixue里,全部 ...

  9. 【爬虫+数据可视化】Python爬取CSDN博客访问量数据并绘制成柱状图

    以下内容为本人原创,欢迎大家观看学习,禁止用于商业及非法用途,谢谢合作! ·作者:@Yhen ·原文网站:CSDN ·原文链接:https://blog.csdn.net/Yhen1/article/ ...

最新文章

  1. puts(char *) gets(char *)
  2. 随机数文件,上传到hdfs的特定目录/logs下,用mr求和
  3. k8s问题 CrashLoopBackOff
  4. zkui - Zookeeper的Web UI界面 windows环境
  5. STM32 通用定时器基本原理
  6. 实例化Model的三种方式
  7. 列举python的五个数据类型_python笔记--数据类型--列表
  8. aix 的c库为什么都是静态库_Linux静态库生成指南
  9. 7-55 列车调度 (25 分)
  10. 计算机容量单位比T,容量单位.比G大是T.比T大是E.比E大是什么?
  11. 一部分 数据 迁移_超原版速度110倍,针对PyTorch的CPU到GPU张量迁移工具开源
  12. if中有return理解
  13. Android Bitmap Drawable 常用摘要
  14. boost::serialization 用基类指针转存派生类(错误多多,一波三折)
  15. 协同过滤算法_《推荐系统实践》3.基于物品的协同过滤算法
  16. python 规则引擎 drools_SpringBoot2整合Drools规则引擎及案例详解
  17. 宇视云所有故障排查思维导图
  18. QT 学习之饼状图实现
  19. swf播放器 android8,网极swf安卓8.0版本-新版网极swf播放器支持安卓8.0下载-游戏大玩家...
  20. 网页设计语言html做思维导图,HTML思维导图

热门文章

  1. 新生代垃圾回收器和老生代垃圾回收器
  2. win10_940MX python3.6深度学习gpu环境搭建入门必看!anaconda3+cuda9.0+cudnn7.0.5+tensorflow1.7.0+keras2.1.6+openCV
  3. AI Talk | AI工业质检之以图搜图引擎
  4. 滤波器中截止频率的理解1
  5. Manjaro系统更新,wifi用不了,解决方法
  6. idea:Build或Rebuild项目特别慢
  7. 人工智能其实就是『八卦』
  8. 多元回归分析--学习笔记
  9. springboot整合ueditor上传图片配置(JSP)从新建项目开始
  10. 服务器 ts250是什么系统,ts250服务器恢复系统