# -- coding: utf-8 --
“””
Created on Tue Oct 10 08:38:20 2017
本段程序为科大王澎老师《网络爬虫,python和数据分析》中P8,针对spyder3做了微调
主要任务:简单的网页抓取
@author:
“””
import re
import urllib.request#urllib2用在python2.7中,在python3中用urllib.request替代之
import pymysql #需要在anaconda3下安装pymysql
from bs4 import BeautifulSoup#注意这里是from bs4
#设置url
url=’http://bbs.ustc.edu.cn/cgi/bbstdoc?board=PieBridge&start=3558’
#打开url
fp=urllib.request.urlopen(url)
#读取结果
s=fp.read()
#用BeautifulSoup分析读取结果s
soup=BeautifulSoup(s)
#找到所有tag的内容
polist=soup.findAll(‘span’)
#显示第一个tag中间的内容
print (polist[0].contents[0])

网络爬虫,python和数据分析学习--part1相关推荐

  1. python爬取地图地址_网络爬虫-python爬取高德地图地点

    python爬取你想要的数据,近期由于业务需求,用python爬取了高德地图一些地点的数据,爬出来数据大致情况如下: image 下面是基本流程: 2.安装网络爬取第三方库,主要是下面三个(pip i ...

  2. java爬取网页数据_Python网络爬虫实战(二)数据解析

    Python网络爬虫实战 (二)数据解析 本系列从零开始阐述如何编写Python网络爬虫,以及网络爬虫中容易遇到的问题,比如具有反爬,加密的网站,还有爬虫拿不到数据,以及登录验证等问题,会伴随大量网站 ...

  3. 网络爬虫——票房网数据抓取及存储

    网络爬虫--票房网数据抓取及存储 实验内容 目标网站:电影票房网 目标网址:http://58921.com/daily/wangpiao 任务要求 目标数据:(1)名次(2)电影名称 (3)日期(4 ...

  4. 基于Thinkphp5+phpQuery 网络爬虫抓取数据接口,统一输出接口数据api

    TP5_Splider 一个基于Thinkphp5+phpQuery 网络爬虫抓取数据接口 统一输出接口数据api.适合正在学习Vue,AngularJs框架学习 开发demo,需要接口并保证接口不跨 ...

  5. 网络爬虫,python和数据分析学习--part2

    Created on Tue Oct 10 10:47:31 2017 本段程序为科大王澎老师<网络爬虫,python和数据分析>中P15,针对spyder3做了微调 主要任务:实现了自动 ...

  6. python爬虫程序详解_Python网络爬虫之三种数据解析方式

    指定url 基于requests模块发起请求 获取响应对象中的数据 进行持久化存储 其实,在上述流程中还需要较为重要的一步,就是在持久化存储之前需要进行指定数据解析.因为大多数情况下的需求,我们都会指 ...

  7. 实战|手把手教你利用Python网络爬虫获取新房数据

    一.项目背景 大家好,我是J哥. 新房数据,对于房地产置业者来说是买房的重要参考依据,对于房地产开发商来说,也是分析竞争对手项目的绝佳途径,对于房地产代理来说,是踩盘前的重要准备. 今天J哥以惠民之家 ...

  8. python爬虫解析数据包_Python网络爬虫之三种数据解析方式

    引入 回顾requests实现数据爬取的流程 指定url 基于requests模块发起请求 获取响应对象中的数据 进行持久化存储 其实,在上述流程中还需要较为重要的一步,就是在持久化存储之前需要进行指 ...

  9. python网络爬虫:股票数据定向爬取

    百度股票(https://gupiao.baidu.com/stock/)属于静态网页数据,适合定向数据爬取:新浪股票(http://finance.sina.com.cn/stock/)数据存取在j ...

最新文章

  1. Wireshark数据包分析之DHCP协议包解读
  2. mvn命令安装jar包--转
  3. 关于错误提示:此实现不是 Windows 平台 FIPS 验证的加密算法的一部分的解决方案...
  4. LeetCode每日一题 52. N皇后 II
  5. filecoin矿机_萤火虫区块链-上海|南京|杭州|苏州萤火虫ipfs|filecoin矿机-奥古斯都分布式存储...
  6. python面试题之迭代器和生成器的区别
  7. echarts固定柱子宽度(barWidth)
  8. day34-2 类和对象(重点)
  9. class反编译成java_Java黑科技之源:JVMTI完全解读
  10. linux下libnet编程 亲自测试可用
  11. ubuntu 系统学习
  12. oracle扩字段长度有什么影响,修改字段长度应用会影响到生产性能
  13. win7 ie11版本安装报此更新不适用于计算机问题
  14. 自制EDL工程线进坚果R1手机9008端口刷机记录
  15. jtag接口_USB接口—Xilinx—JTAG烧写器(电路图、PCB片段、烧写器配置固件)设计方案...
  16. java entry的用法_Java ZipEntry setComment()用法及代码示例
  17. mysql migration toolkit 使用_MySQL Migration Toolkit的使用
  18. JavaScript Canvas2D实现SpriteSheet角色动画
  19. 实习每日总结_20161219
  20. NAS如何进行磁盘碎片整理?

热门文章

  1. iPhone5s配置网易邮箱
  2. 蘑菇君深入源码学习Tomcat系列 (1) - Tomcat与Servlet的那些事
  3. 【实战-干货】手把手带你搭建自己的FTP服务器,实现文件上传、下载
  4. 北大青鸟昌平校区:学软件测试有年龄限制吗?
  5. 客服对于网店的重要性
  6. android手机安装时缺少google map api 的解决方法
  7. IDEA Live Lemplates
  8. iphone12上市时间已定 iphone12mini/12max/12pro售价曝光
  9. 【引用】iPhone开发内存管理
  10. 屏幕分辨率测试工具(舍弃)---chrome开发者工具devTools(强烈建议系统学习)