爬取单一网页上的内容,并保存到txt文档内,以小说排行榜首页为例:

import requests
import time
import re
 
url = 'http://top.baidu.com/buzz/book.html'
res = requests.get(url)
res.encoding = 'gb2312'
kk = '<a class=".*?" target=".*?" href="(.*?)" href_top=".*?">(.*?)</a>'
url_list = re.findall(kk, res.text)
for i in range(len(url_list)):with open('D:\\***\\***.txt', 'a') as f:f.write(str(i+1) + '、' + str(url_list[i]) + '\n')print('{}.{}\t'.format(i, url_list[i]))time.sleep(1)

这里通过正则来选取了百度链接以及小说的名字,在写入txt文档里面的时候加入了排名序号。

我曾经跨过山和大海,也穿过人山人海,我曾经拥有着的一切,转眼都飘散如烟,我曾经失落失望失掉所有方向,直到看见平凡才是唯一的答案。
                                                                                                                                                            ——韩寒《平凡之路》

python虫虫(平凡之路)相关推荐

  1. 平凡之路:计算机基础+python初体验

    主要内容: 计算机发展史 计算机硬件及操作系统 字符编码简介 Python简介 Python基础知识 一.初窥计算机的世界 1.简述计算机的发展史 从第一台电子计算机发展到今日,掐指算下来也有70余年 ...

  2. python虫虫(抖音歌曲大全)

    配置说明: Anaconda 4.2.0(64-bit) Python 3.5.2 程序: import requests import re import time url = 'https://w ...

  3. Bug heroes虫虫英雄······超详细翻译+基本攻略

    转载自:http://apple.zone.it.sohu.com/forums/thread-4588491-1-1.html 游戏真的很不错!感谢威锋[url=u-htm-action-show- ...

  4. 虫虫博客2009-如何把搜索引擎排名维护好

    重建站第一项要做的事情就是用SEO来思考新网站该以什么新形式出现.不同于从来没有过网站的情况,新的网站在建设过程中,要考虑保持原来网站的即有排名,特别是一些重要的关键词排名.那么如何保护好搜索引擎排名 ...

  5. 精选案例 | “虫虫音乐”如何做到搜索CTR提高150%

    简介:简介: 本文通过[虫虫音乐]在阿里云开放搜索的最佳实践,和大家介绍影音行业如何快速实现高质量的搜索服务助力业务更好发展! 公司背景 虫虫音乐是一家版权乐谱分发平台,致力于专业打造音乐教育和乐谱版 ...

  6. 开启Python自动化运维之路

    关于Python的入门,推荐Dive into Python及廖雪峰的Python教程. 第一个程序 学一门语言,按惯例都要先来一个Hello World! 代码高亮效果 代码如下: print(&q ...

  7. python自动化运维之路~DAY1

    python自动化运维之路~DAY1 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.文件大小单位单位换算 我们一起看一下下面的图: 没错,都是数字,而且这些数字都是二进制的数字 ...

  8. 地图标识符号大全_【好玩微信小游戏大全】虫虫逃亡:烧脑游戏佳作!强烈推荐!...

    沐沐带你发现好游戏! 只有你想不到, 没有我找不到的好游戏! 「良心好游戏推荐」 搜罗了好玩的微信小游戏大全, 模拟经营游戏.恐怖游戏.消除游戏.休闲游戏.益智游戏.解密游戏.烧脑游戏.解谜游戏大全. ...

  9. 中国民生银行天眼日志平台架构演进的平凡之路

    本文由 [AI前线]原创,原文链接:t.cn/RYgJ8hD AI 前线导读: "随着中国民生银行的 IT 业务系统的迅速发展,主机.设备.系统.应用软件数量不断增多,业务资源访问.操作量不 ...

最新文章

  1. Houdini Krakatoa Render Plugin
  2. Java中的面向对象
  3. body curl 设置post_深入说说postman发送post请求
  4. Eclipse基础设置
  5. OpenCV cv::Mat类
  6. python处理中文字符串_python字符串中的中文处理
  7. 平衡小车卡尔曼滤波算法
  8. 像个字段相减绝对值_张歆艺做家务受伤,袁弘俩字逗乐媳妇,真是幼稚得像个大龄儿童...
  9. 夫妻俩70岁积蓄70万元,俩人退休金8000元,还需要理财吗?
  10. 亚马逊向GuardDuty服务添加三种新的威胁检测规则
  11. 写了一百万行代码是什么体验?
  12. gridview為什麼分頁後,GridView1_RowDataBound就運行不了
  13. 设计模式GOF23大纲
  14. u盘写保护怎么才能真正去掉
  15. eclipse-embed
  16. 听见丨谷歌DeepMind科学家黄士杰:已离开AlphaGo团队AI芯片初创团队ThinkForce完成4.5亿元A轮融资
  17. 四足机器人关节锁死故障的容错问题
  18. pycharm如何打开历史_如何在pycharm中反转控制台历史顺序以进行复制粘贴?
  19. python 读取zip包中的数据
  20. theano环境配置

热门文章

  1. Burst Buffer技术为何在HPC如此盛行
  2. 线程—并发编程(2)
  3. 超难智力题(答案几日后公布)
  4. 首师大附中OJ系统 0001 Hello world
  5. 联邦学习+拆分学习|SplitFed: When Federated Learning Meets Split Learning
  6. 一个简单的WebService调用天气预报接口的demo
  7. 讨论使用计算机技术,计算机技术在电力调度运行中的应用探讨
  8. EXCEL:Excel2007中的数据分析工具在哪里?
  9. 【有奖活动】华章IT15周年,评选您心中最有影响力的10种图书
  10. 你应该知道的前端面试题(万字总结)