Created on Tue Oct 10 10:47:31 2017
本段程序为科大王澎老师《网络爬虫,python和数据分析》中P15,针对spyder3做了微调
主要任务:实现了自动抓取多网页
@author:
“””
import re
import urllib.request
import pymysql
from bs4 import BeautifulSoup
aaa = 3640
url1=’http://bbs.ustc.edu.cn/cgi/bbstdoc?board=PieBridge&start=’
while aaa>0:
aaa=aaa-20#网站link有规律,每页递减20,利用该规律设置每次赋入的URL,爬完所有贴
aaa1=str(aaa)
url1=url1+aaa1
fp=urllib.request.urlopen(url1)
s=fp.read()
soup=BeautifulSoup(s)
polist=soup.findAll(‘span’)
print (polist[1].contents[1])

网络爬虫,python和数据分析学习--part2相关推荐

  1. python爬取地图地址_网络爬虫-python爬取高德地图地点

    python爬取你想要的数据,近期由于业务需求,用python爬取了高德地图一些地点的数据,爬出来数据大致情况如下: image 下面是基本流程: 2.安装网络爬取第三方库,主要是下面三个(pip i ...

  2. java爬取网页数据_Python网络爬虫实战(二)数据解析

    Python网络爬虫实战 (二)数据解析 本系列从零开始阐述如何编写Python网络爬虫,以及网络爬虫中容易遇到的问题,比如具有反爬,加密的网站,还有爬虫拿不到数据,以及登录验证等问题,会伴随大量网站 ...

  3. 网络爬虫——票房网数据抓取及存储

    网络爬虫--票房网数据抓取及存储 实验内容 目标网站:电影票房网 目标网址:http://58921.com/daily/wangpiao 任务要求 目标数据:(1)名次(2)电影名称 (3)日期(4 ...

  4. 基于Thinkphp5+phpQuery 网络爬虫抓取数据接口,统一输出接口数据api

    TP5_Splider 一个基于Thinkphp5+phpQuery 网络爬虫抓取数据接口 统一输出接口数据api.适合正在学习Vue,AngularJs框架学习 开发demo,需要接口并保证接口不跨 ...

  5. 网络爬虫,python和数据分析学习--part1

    # -- coding: utf-8 -- """ Created on Tue Oct 10 08:38:20 2017 本段程序为科大王澎老师<网络爬虫,pyt ...

  6. python爬虫程序详解_Python网络爬虫之三种数据解析方式

    指定url 基于requests模块发起请求 获取响应对象中的数据 进行持久化存储 其实,在上述流程中还需要较为重要的一步,就是在持久化存储之前需要进行指定数据解析.因为大多数情况下的需求,我们都会指 ...

  7. 实战|手把手教你利用Python网络爬虫获取新房数据

    一.项目背景 大家好,我是J哥. 新房数据,对于房地产置业者来说是买房的重要参考依据,对于房地产开发商来说,也是分析竞争对手项目的绝佳途径,对于房地产代理来说,是踩盘前的重要准备. 今天J哥以惠民之家 ...

  8. python爬虫解析数据包_Python网络爬虫之三种数据解析方式

    引入 回顾requests实现数据爬取的流程 指定url 基于requests模块发起请求 获取响应对象中的数据 进行持久化存储 其实,在上述流程中还需要较为重要的一步,就是在持久化存储之前需要进行指 ...

  9. python网络爬虫:股票数据定向爬取

    百度股票(https://gupiao.baidu.com/stock/)属于静态网页数据,适合定向数据爬取:新浪股票(http://finance.sina.com.cn/stock/)数据存取在j ...

最新文章

  1. 2021年大数据常用语言Scala(十八):基础语法学习 Map对象
  2. 双节棍「大师」鱼佬亲传武功秘籍:如何进行一场数据挖掘算法竞赛?
  3. 大学开设python课程吗_在大学为什么你一定要学会Python?
  4. Hadoop实战实例
  5. 寻找正反物质世界边境的长城---兵粒子
  6. linux之heartbeat高可用的简单配置
  7. PPT 2016 后台播放功能
  8. 自我总结 (三) --(Java Web学习)
  9. 我的世界大佬最多的服务器,《我的世界》门槛最高的红石服务器TIS,看看你跟大佬们的差距吧...
  10. linux make使用技巧
  11. Mac 上删除用户或群组教程
  12. go generate 生成代码
  13. Julia: 通过简单实践理解机器学习概念(flux.jl)
  14. 计算机kb和gb单位的在线换算器,KB/MB/GB。。单位换算
  15. 灵敏度和特异度的置信区间怎么算?
  16. poi根据模版导出多页word,带插入图片,并压缩下载
  17. ajax 皇马,历史上最伟大11支球队 西班牙国家队在列 皇马两次入选
  18. 人人网,给我个“上”你的理由吧?
  19. commit规范使用gitmoji全流程 cz-customizable+commitlint+husky+conventional-changelog
  20. FTP服务器文件的批量下载

热门文章

  1. highchart图表设置加载页面
  2. cmd 命令行 mysql导入sql文件到指定数据库
  3. 使用Echarts创建好看的仪表盘
  4. ORM中related_name属性的使用
  5. matcher java_Java Matcher类详解
  6. 经典的20道AJAX面试题
  7. 掌财社:最强鸿蒙概念股”停牌核查 润和软件被散户买爆?
  8. CSS3动画--木马图
  9. Halcon 一维码识别
  10. Vijos P1071 新年趣事之打牌