下面我们创建一个真正的爬虫例子

爬取我的博客园个人主页首页的推荐文章列表和地址

scrape_home_articles.py

from urllib.request importurlopenfrom bs4 importBeautifulSoupimportre

html= urlopen("http://www.cnblogs.com/davidgu")

bsObj= BeautifulSoup(html, "html.parser")for link in bsObj.find("div", {"id":"main_container"}).findAll("a", href=re.compile("^http://www.cnblogs.com/davidgu/p")):if 'href' in link.attrs and not('class' inlink.attrs):print(link.string)print(link.attrs['href'])print("--------------------------------------------------------------")

运行结果:

[置顶]解决adb server端口被占用的问题

http://www.cnblogs.com/davidgu/p/4515236.html

--------------------------------------------------------------

[置顶]解决Eclipse下不自动拷贝apk到模拟器问题( The connection to adb is down, and a sever

http://www.cnblogs.com/davidgu/p/4390661.html

--------------------------------------------------------------

常用的正则表达式一览

http://www.cnblogs.com/davidgu/p/4831357.html

--------------------------------------------------------------

C++ 11 - STL - 函数对象(Function Object) (上)

http://www.cnblogs.com/davidgu/p/4829097.html

--------------------------------------------------------------

...

python网页爬虫例子_Python网络爬虫 - 一个简单的爬虫例子相关推荐

  1. $python爬虫系列(1)——一个简单的爬虫实例

    本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片. 1. 概述 本文主要实现一个简单的爬虫,目的是从一个百度贴吧页面下载图片.下载图片的步骤如下: 获取网页html文本内容: 分析html ...

  2. python写rest服务_Python 如何创建一个简单的REST接口

    问题 你想使用一个简单的REST接口通过网络远程控制或访问你的应用程序,但是你又不想自己去安装一个完整的web框架. 解决方案 构建一个REST风格的接口最简单的方法是创建一个基于WSGI标准(PEP ...

  3. python商品监控系统_Python写的一个简单监控系统

    市面上有很多开源的监控系统:Cacti.nagios.zabbix.感觉都不符合我的需求,为什么不自己做一个呢 用Python两个小时徒手撸了一个简易的监控系统,给大家分享一下,希望能对大家有所启发 ...

  4. python爬虫入门教程(二):开始一个简单的爬虫

    2019/10/28更新 使用Python3,而不再是Python2 转载请注明出处:https://blog.csdn.net/aaronjny/article/details/77945329 爬 ...

  5. 网络爬虫笔记 :一个简单的爬虫框架

    学了两节课的 Python 爬虫,也算是入门了吧.敲了两天的案例代码之后,我突然发现,这些代码虽然功能不同,写法各异,但是终归是有章可循的,整体框架是一致的.所以我自己整理了一个简单的爬虫框架,适合初 ...

  6. 四句话让你学会一个简单的爬虫【python】

    首先我们先导入request库,这样才能调用requests里面的函数 os库是为了存放我们爬过来的文件 import requests import os 如何四句话实现一个简单的爬虫 pic = ...

  7. python小项目实例流程-Python小项目:快速开发出一个简单的学生管理系统

    原标题:Python小项目:快速开发出一个简单的学生管理系统 本文根据实际项目中的一部分api 设计抽象出来,实例化成一个简单小例子,暂且叫作「学生管理系统」. 这个系统主要完成下面增删改查的功能: ...

  8. python小项目案例-Python小项目:快速开发出一个简单的学生管理系统

    本文根据实际项目中的一部分api 设计抽象出来,实例化成一个简单小例子,暂且叫作「学生管理系统」. 这个系统主要完成下面增删改查的功能: 包括: 学校信息的管理 教师信息的管理 学生信息的管理 根据A ...

  9. 轻松创建nodejs服务器(1):一个简单nodejs服务器例子

    这篇文章主要介绍了一个简单nodejs服务器例子,本文实现了一个简单的hello world例子,并展示如何运行这个服务器,需要的朋友可以参考下 我们先来实现一个简单的例子,hello world. ...

  10. python项目开发实例-Python小项目:快速开发出一个简单的学生管理系统

    本文根据实际项目中的一部分api 设计抽象出来,实例化成一个简单小例子,暂且叫作「学生管理系统」. 这个系统主要完成下面增删改查的功能: 包括: 学校信息的管理 教师信息的管理 学生信息的管理 根据A ...

最新文章

  1. 【转】Mac 程序员的十种武器
  2. Mac vscode 调试打印有问题 输出缓冲区 “\r\n“
  3. linux系统添加网卡驱动,Linux 2.6.35内核配置和网卡驱动添加
  4. 百度媒体云智能编码技术实践
  5. iOS开发:remove reference与move to trash的区别
  6. php自定义session存储路径
  7. 12个免费的 Twitter Bootstrap 后台模板
  8. 申通快递机器人上岗_【峰暴】618, 数万台机器人上岗为您服务!
  9. SQL Server索引超出了数组界限解决方法
  10. dm数据库 linux版下载,达梦(DM)数据库Linux部署安装
  11. linux centos 环境下Device eth0 does not seem to be present,delaying initialization. 问题处理
  12. 神仙打架!今年计算机考研爆炸实况!
  13. 点线面的特点_描述点线面状事物分布特征
  14. IU酒店释放轻中端投资活力,开启曲靖酒店新篇章
  15. Scratch制作贪吃蛇
  16. Python--Redis实战:第五章:使用Redis构建支持程序:第2节:计数器和统计数据...
  17. 千亿智能家居赛道,为什么渗透率却不足5%?
  18. Win11网络延迟太高怎么办?
  19. Python之报错AttributeError:'CocaCola' object has no attribute 'local_logo'
  20. 什么是前端脚手架?脚手架原理?

热门文章

  1. 日期插件rolldate.js的使用
  2. CSS3中的圆角边框属性详解(border-radius属性)
  3. 学习关于display :flex 布局问题!
  4. Unity3D_(游戏)2D坦克大战 像素版
  5. 《Linux命令行与shell脚本编程大全 第3版》创建实用的脚本---10
  6. mock接口开发,excel(读,写,修改)
  7. linux常用命令-压缩解压命令
  8. Spring事务配置方式(一) 拦截器方式配置
  9. 菜鸟nginx源码剖析
  10. for,foreach,iterator的用法和区别