python学习-抓取知乎图片

#!/bin/usr/env python3__author__ = 'nxz'"""
抓取知乎图片
webdriver Chromedriver驱动需要安装,并指定driver位置(不同chrome版本需要不同的驱动)
"""import re  # 正则
from selenium import webdriver  # 模拟登陆
import time
import urllib.request
from bs4 import BeautifulSoupdriver = webdriver.Chrome("E:\python插件\chromedriver.exe")
driver.maximize_window()
driver.get("https://www.zhihu.com/question/29134042")
result_raw = BeautifulSoup(open('test.html', encoding='utf-8'), 'lxml')
content_list = result_raw.select("noscript")for content in content_list:result = BeautifulSoup(content.string,'lxml')imgs = result.select('img')for img in imgs:with open('img.txt', 'a', encoding='utf-8') as f:f.write(img['src'] + '\n')
print("fetch --->>> end")

posted @ 2019-04-04 15:03 巡山小妖N 阅读(...) 评论(...) 编辑 收藏

python学习-抓取知乎图片相关推荐

  1. Python爬虫实战,requests模块,Python实现抓取知乎热点话题

    前言 利用Python实现抓取知乎热点话题,废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: requests模块: re模块: pandas模块: lxml模 ...

  2. Python+BeautifulSoup抓取暴走漫画页面图片

    使用Python中的BeautifulSoup(bs4)包抓取暴走漫画网站中的热门帖子中的图片. 首先附上参考资料,之前在OSC上有人写了个抓取豆瓣妹子图片的帖子,参考人家的代码,自己重新弄了一下,当 ...

  3. Python 爬虫: 抓取花瓣网图片

    接触Python也好长时间了,一直没什么机会使用,没有机会那就自己创造机会!呐,就先从爬虫开始吧,抓点美女图片下来. 废话不多说了,讲讲我是怎么做的. 1. 分析网站 想要下载图片,只要知道图片的地址 ...

  4. python爬虫爬取知乎图片,轻松解决头像荒

    前言 最近逛知乎,发现了一个问题.         回答下很多好看的头像,因此我动了一个心思,想要制作一个小网页,可以随机返回一款好看的情头.心思既起,当然要开始付诸行动.但是想要制作如此一个网页,后 ...

  5. Python爬虫抓取指定网页图片代码实例

    更多编程教程请到:菜鸟教程 https://www.piaodoo.com/ 友情链接:好看站 http://www.nrso.net/ 高州阳光论坛https://www.hnthzk.com/ 想 ...

  6. python爬虫抓取淘宝图片

    训练模型需要data,于是从网上抓取相关图片集,之后进行筛选标注. import urllib.request import rekeyword = '骚猪'#定义搜索关键字 keyword = ur ...

  7. python 爬虫 抓取网站img图片

    from getHtml import getHtmlWinthIp from getHtml import getHtml from bs4 import BeautifulSoup from ur ...

  8. python抓取网站图片_python抓取图片示例 python抓取网页上图片

    python抓取网页上图片 这个错误时是什么意思 下面是代码 import re import urllib.request imp正则表达式匹配的url有错误 for x in add: print ...

  9. Python学习教程:Python爬虫抓取技术的门道

    Python学习教程:Python爬虫抓取技术的门道 web是一个开放的平台,这也奠定了web从90年代初诞生直至今日将近30年来蓬勃的发展.然而,正所谓成也萧何败也萧何,开放的特性.搜索引擎以及简单 ...

最新文章

  1. JVM源码分析之FinalReference完全解读
  2. 利用程序动态管理Web.config文件的配置
  3. 文本深度表示模型Word2Vec
  4. BF533和触摸屏接口芯片TSC2200调试日志
  5. 台式计算机风扇声音大怎么处理,如何解决电脑电源风扇声音大的问题?
  6. leetcode39. 组合总和(回溯)
  7. AndroidStudio安卓原生开发_Activity的启动模式部分singleTop启动模式和singleTask启动模式---Android原生开发工作笔记87
  8. 【Java从0到架构师】git 核心原理和分支管理
  9. 随机梯度下降法(SGD)
  10. 群晖使用ClouDNS免费DDNS解析
  11. 专业PE优盘启动制作工具 - 优启通
  12. gamit数据处理—5.遇到的问题
  13. 远程桌面连接:系统管理员已限制你登录的计算机处理方法
  14. Python数据分析案例篇(一)泰坦尼克号数据分析
  15. BFF —— Backend For Frontend
  16. 养兔子c语言sdut,SDUT 养兔子
  17. 关于trunk的几个端口模式
  18. eclipse配置glassfish插件和密码
  19. drools规则引擎并发结果不准确问题记录
  20. C#普通计算器与科学计算器

热门文章

  1. 赶集网MySQL开发36军规
  2. visual code php,vscode(Visual Studio Code)配置PHP开发环境的方法(已测)_编程开发_软件教程...
  3. spring boot-The temporary upload location [ ] is not valid
  4. 探测器反向偏压_科学网—《涨知识啦22》---MSM型光电探测器 - 寇建权的博文
  5. 重庆邮电大学计算机学院院徽,Slide计算机学院-重庆邮电大学.PPT
  6. element ui分页怎么做_Vue Element分页器
  7. 计算机工具软件应用考试,《计算机常用工具软件》期中考试题
  8. java doubke类型转换为String_Java基础知识面试题大集合
  9. 7z001怎么解压在安卓手机上面_安卓手机能打开eif文件吗 手机怎么打开eip文件方法...
  10. python3.4.4怎么用_python3.4使用文件