我试图从以下链接中获取以下svg:

我要刮的部分如下:

我不需要图表中的文字(只需要图表本身)。但是,我以前从来没有抓取过svg图像,我不确定这是否可能。我环顾四周,但找不到任何有用的python包来直接执行此操作。在

我知道我可以用python使用selenium截图图像,然后使用PIL裁剪它并将其保存为svg,但我想知道是否有更直接的方法从页面上获取这些图表。任何有用的包或实现都会很有帮助。谢谢您。在

编辑:得到了一些反对票,但不确定为什么我会以我的方式来实施它。。在import sys

import time

from PyQt4.QtCore import *

from PyQt4.QtGui import *

from PyQt4.QtWebKit import *

class Screenshot(QWebView):

def __init__(self):

self.app = QApplication(sys.argv)

QWebView.__init__(self)

self._loaded = False

self.loadFinished.connect(self._loadFinished)

def capture(self, url, output_file):

self.load(QUrl(url))

self.wait_load()

# set to webpage size

frame = self.page().mainFrame()

self.page().setViewportSize(frame.contentsSize())

# render image

image = QImage(self.page().viewportSize(), QImage.Format_ARGB32)

painter = QPainter(image)

frame.render(painter)

painter.end()

print 'saving', output_file

image.save(output_file)

def wait_load(self, delay=0):

# process app events until page loaded

while not self._loaded:

self.app.processEvents()

time.sleep(delay)

self._loaded = False

def _loadFinished(self, result):

self._loaded = True

s = Screenshot()

s.capture('https://finance.yahoo.com/quote/AAPL/analysts?p=AAPL', 'yhf.png')

然后我将使用PIL中的crop函数将图像从图表中取出。在

python 爬取svg数据_抓取SVG图表相关推荐

  1. python爬关键词百度指数_Python 抓取指定关键词的百度指数

    百度指数很多时候在我们做项目的时候会很有帮助,从搜索引擎的流量端给到我们一些帮助,比如:家具行业的销量跟"装修","新房","二手房"等关键 ...

  2. java取网页数据_Java抓取网页数据(原来的页面+Javascript返回数据)

    转载请注明出处. 有时候因为种种原因.我们须要採集某个站点的数据.但因为不同站点对数据的显示方式略有不同! 本文就用Java给大家演示怎样抓取站点的数据:(1)抓取原网页数据.(2)抓取网页Javas ...

  3. python爬取下拉列表数据_python 抓取下拉列表控制的表格的所有数据

    目标是抓取所有选项下的表格数据. 用开发者工具查看表格及选项框的构造: 下拉框是 标签组成的,用js实现动态切换,靠selenium很难实现定位和模拟点击. 解决方法:分析页面网络请求流,尝试抓取服务 ...

  4. fiddler不能抓取浏览器数据_抓包软件 Fiddler 了解一下?

    学会如何抓包,是爬虫的必备技能,甚至可以说,不会抓包就等同于不会爬虫. 那我们怎样抓包呢?如果直接抓取浏览器上的内容,可以直接使用开发者工具进行抓包,但有个局限,只能抓浏览器的,功能也没有多少.还可以 ...

  5. 使用python和tableau对数据进行抓取及可视化

    本篇文章介绍使用python抓取贷款及理财平台的数据,并将数据拼接和汇总.最终通过tableau进行可视化.与之前的python爬虫文章 不同之处在于之前是一次性抓取生产数据表,本次的数据需要每天重复 ...

  6. excel抓取数据_抓取具有要求的excel在线只读文件

    excel抓取数据 In a previous article https://medium.com/@hanqi_47643/scraping-excel-online-read-only-file ...

  7. python爬去百度音乐_Python抓取百度音乐。

    今天挑战下百度音乐抓取,先用Chrome分析下请求的链接. 最关键的就是这个链接 http://play.baidu.com/data/music/songlink 请求这个带上songid就能返回给 ...

  8. python爬大学生就业数据_小猪的Python学习之旅 —— 16.再尝Python数据分析:采集拉勾网数据分析Android就业行情...

    一句话概括本文: 爬取拉钩Android职位相关数据,利用numpy,pandas和matplotlib对招人公司 情况和招聘要求进行数据分析. 引言: 在写完上一篇<浅尝Python数据分析: ...

  9. python爬空气污染实时数据_一键爬取空气质量相关指数

    刚刚入门python,想上手一些比较简单的爬虫项目.今天我们来爬一爬一个空气质量指数的网站来获取全国城市的空气质量指数.记得跟着我的思路来哟! 前期准备工作 首先一个舒服的pythonIDLE肯定是必 ...

最新文章

  1. R语言Logistic回归模型案例:分析吸烟、饮酒与食管癌的关系
  2. 排班系统c语言设计说明,帮我设计一个关于员工排班的C语言程序
  3. c++ 互斥量和条件变量
  4. Visual Source Safe(VSS)使用教程
  5. python mysql操作_Python的MySQL操作
  6. oracle 实时负载查询,Oracle并行查询
  7. HYSBZ/BZOJ 1007 [HNOI2008] 水平可见直线 - 计算几何
  8. 转载:SQL入门教程
  9. jpeg-turbo源码下载及使用NDK编译android库
  10. 8155_QFIL烧录
  11. Charles抓包安卓端
  12. 文本分类(三) | (6) 番外篇(预训练语言模型的另一种使用方式)
  13. python 经典图书排行榜_书榜 | 计算机书籍(8.12-8.18)销售排行榜
  14. JAVA_OPTS(JVM相关运行参数的变量)设置
  15. ubuntu 域名解析暂时失败
  16. pythongui界面实现爬取b站弹幕_Python爬虫自动化爬取b站实时弹幕实例方法
  17. IOS 自定义 滑动返回 手势
  18. 复习专栏之---面试总结
  19. 给你一个app如何测试?面试题
  20. 数据库表去除重复数据

热门文章

  1. 飞畅科技-交换机的三种交换方式详解
  2. 【渝粤题库】陕西师范大学164212 国际贸易实务 作业(专升本)
  3. LoRa、Sigfox和NB-IoT在物联网趋势中谁是你的最佳拍档?
  4. linux 软件 名称 更新,linux软件版本管理命令update-alternatives使用详解
  5. 2020-12-19通信电子线路第一章
  6. LaTeX双栏模板插入通栏公式(跨栏插图)
  7. 【BCH码1】系统BCH码编码原理及MATLAB实现(不使用MATLAB库函数)
  8. html制作任务计划列表网页,添加计划任务的脚本
  9. python变量持久化_Python 数据持久化:JSON
  10. JavaScript里面的居民们1-数据