练习要求:

在“http://money.cnn.com/data/dow30/”上抓取道指成分股数据并将30家公司的代码、公司名称和最近一次成交价放到一个列表中输出。

代码:

# -*- coding: utf-8 -*-
"""
Spyder EditorThis is a temporary script file.
"""
import requests
import re
r = requests.get("https://money.cnn.com/data/dow30/") #爬取网页内容
reg = re.compile('class="wsod_symbol">(.*?)<\/a>.*?<span.*?">(.*?)<\/span>.*?\n.*?class="wsod_stream">(.*?)<\/span>') #预编译正则表达式
ans = re.findall(reg, r.text) #利用正则表达式解析内容
print("%-7s%-20s%-10s" % ('Code','Name','Prize')) #占位输出
for key in ans:print("%-7s%-20s%-10s" % (key[0],key[1],key[2]))

运行效果:

python爬虫练习2:取道指成分股数据相关推荐

  1. python爬虫:抓取道指成分股数据

    题目要求 在"http://money.cnn.com/data/dow30/"上抓取道指成分股数据并将30家公司的代码.公司名称和最近一次成交价放到一个列表中输出. 代码 imp ...

  2. AJAX教程美食滤镜,Python爬虫实例——爬取美团美食数据

    1.分析美团美食网页的url参数构成 1)搜索要点 美团美食,地址:北京,搜索关键词:火锅 2)爬取的url https://bj.meituan.com/s/%E7%81%AB%E9%94%85/ ...

  3. Python爬虫4.2 — ajax(动态网页数据抓取)用法教程

    Python爬虫4.2 - ajax[动态网页数据]用法教程 综述 AJAX 介绍 什么是AJAX 实例说明 请求分析 获取方式 实例说明 其他博文链接 综述 本系列文档用于对Python爬虫技术的学 ...

  4. python爬虫——使用selenium爬取微博数据(一)

    python爬虫--使用selenium爬取微博数据(二) 写在前面 之前因为在组里做和nlp相关的项目,需要自己构建数据集,采用selenium爬取了几十万条微博数据,学习了很多,想在这里分享一下如 ...

  5. python爬虫实战之异步爬取数据

    python爬虫实战之异步爬取数据 文章目录 前言 一.需求 二.使用步骤 1.思路 2.引入库 3.代码如下 总结 前言 python中异步编程的主要三种方法:回调函数.生成器函数.线程大法. 以进 ...

  6. Python爬虫:抓取多级页面数据

    前面讲解的爬虫案例都是单级页面数据抓取,但有些时候,只抓取一个单级页面是无法完成数据提取的.本节讲解如何使用爬虫抓取多级页面的数据. 在爬虫的过程中,多级页面抓取是经常遇见的.下面以抓取二级页面为例, ...

  7. Python爬虫入门实战之猫眼电影数据抓取(理论篇)

    前言 本文可能篇幅较长,但是绝对干货满满,提供了大量的学习资源和途径.达到让读者独立自主的编写基础网络爬虫的目标,这也是本文的主旨,输出有价值能够真正帮助到读者的知识,即授人以鱼不如授人以渔,让我们直 ...

  8. Python爬虫学习之第七天---数据提取-lxml模块和Xpath使用

    爬虫学习之第七天-数据提取-lxml模块和Xpath使用 知识点:了解 lxml模块和xpath语法的关系了解 lxml模块的使用场景了解 lxml模块的安装了解 谷歌浏览器xpath helper插 ...

  9. 一个月入门Python爬虫,轻松爬取大规模数据

    如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这样一个月入门Python爬虫,轻松爬的编程语言提供越来越多的优秀工具,让爬虫 ...

  10. python爬虫scrapy框架爬取网页数据_Scrapy-Python

    scrapy Scrapy:Python的爬虫框架 实例Demo 抓取:汽车之家.瓜子.链家 等数据信息 版本+环境库 Python2.7 + Scrapy1.12 初窥Scrapy Scrapy是一 ...

最新文章

  1. nginx+php-fpm 的配置下,php的错误日志
  2. 吉林大学计算机科学与技术学院王欣,应用改进迭代最近点方法的点云数据配准...
  3. SpringBoot项目新手——问题疑惑及解决笔记
  4. Sonar6.0应用之一:基于centos7.2安装
  5. [Android] Bitmap OOM解决办法一
  6. iPhone 13 的十大爆料:“十三”到底“香不香”?
  7. Mybatis 与Spring整合及原理
  8. 2 docker镜像
  9. Linux之用户/组管理以及任务调度学习总结
  10. 谷歌浏览器如何安装插件-以octotree为例
  11. weka的java环境配置_weka环境配置
  12. Https网络安全传输详解
  13. 软通动力华为外包_软通动力外包到百度?
  14. 【小型系统】简单的刷票系统(突破IP限制进行投票)
  15. stm32f4定时器时钟频率/选择
  16. ROS的四种通信架构
  17. 很牛的求职历程和经验(二)
  18. 从ServerSwitch到SONiC Chassis:数据中心交换机技术的十年探索历程
  19. 微信小程序 (布局适配与物理逻辑像素)
  20. 昨天刚扩容80G,今天C盘就爆满了?C盘莫名其妙少了60G,使用Spacesniff也扫描不出来

热门文章

  1. 医学信息学计算机技术,2017年医学信息学专业大学排名
  2. 华为2019年8月校招秋招笔试机考题解答C++实现
  3. 华为2019实习生机试题1
  4. 如果看了此文你还不懂傅里叶变换,那就过来掐死我吧【完整版】
  5. linux 修改密码 authen,Linux系统下root用户执行passwd修改密码时报错Authentication to
  6. ROS机器人语音交互(一)
  7. 北京云计算HCIE培训机构入门技术快速了解laaS、Paas和 SaaS的区别-ielab网络实验室
  8. 2018年我国人均国民总收入达到9732美元,国民经济持续快速增长
  9. cad补全三视图_cad补画三视图练习题.doc
  10. 仿CAD画椭圆弧步骤思路(附加代码)