python学习-抓取知乎图片
python学习-抓取知乎图片
#!/bin/usr/env python3__author__ = 'nxz'"""
抓取知乎图片
webdriver Chromedriver驱动需要安装,并指定driver位置(不同chrome版本需要不同的驱动)
"""import re # 正则
from selenium import webdriver # 模拟登陆
import time
import urllib.request
from bs4 import BeautifulSoupdriver = webdriver.Chrome("E:\python插件\chromedriver.exe")
driver.maximize_window()
driver.get("https://www.zhihu.com/question/29134042")
result_raw = BeautifulSoup(open('test.html', encoding='utf-8'), 'lxml')
content_list = result_raw.select("noscript")for content in content_list:result = BeautifulSoup(content.string,'lxml')imgs = result.select('img')for img in imgs:with open('img.txt', 'a', encoding='utf-8') as f:f.write(img['src'] + '\n')
print("fetch --->>> end")
posted @ 2019-04-04 15:03 巡山小妖N 阅读(...) 评论(...) 编辑 收藏
python学习-抓取知乎图片相关推荐
- Python爬虫实战,requests模块,Python实现抓取知乎热点话题
前言 利用Python实现抓取知乎热点话题,废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: requests模块: re模块: pandas模块: lxml模 ...
- Python+BeautifulSoup抓取暴走漫画页面图片
使用Python中的BeautifulSoup(bs4)包抓取暴走漫画网站中的热门帖子中的图片. 首先附上参考资料,之前在OSC上有人写了个抓取豆瓣妹子图片的帖子,参考人家的代码,自己重新弄了一下,当 ...
- Python 爬虫: 抓取花瓣网图片
接触Python也好长时间了,一直没什么机会使用,没有机会那就自己创造机会!呐,就先从爬虫开始吧,抓点美女图片下来. 废话不多说了,讲讲我是怎么做的. 1. 分析网站 想要下载图片,只要知道图片的地址 ...
- python爬虫爬取知乎图片,轻松解决头像荒
前言 最近逛知乎,发现了一个问题. 回答下很多好看的头像,因此我动了一个心思,想要制作一个小网页,可以随机返回一款好看的情头.心思既起,当然要开始付诸行动.但是想要制作如此一个网页,后 ...
- Python爬虫抓取指定网页图片代码实例
更多编程教程请到:菜鸟教程 https://www.piaodoo.com/ 友情链接:好看站 http://www.nrso.net/ 高州阳光论坛https://www.hnthzk.com/ 想 ...
- python爬虫抓取淘宝图片
训练模型需要data,于是从网上抓取相关图片集,之后进行筛选标注. import urllib.request import rekeyword = '骚猪'#定义搜索关键字 keyword = ur ...
- python 爬虫 抓取网站img图片
from getHtml import getHtmlWinthIp from getHtml import getHtml from bs4 import BeautifulSoup from ur ...
- python抓取网站图片_python抓取图片示例 python抓取网页上图片
python抓取网页上图片 这个错误时是什么意思 下面是代码 import re import urllib.request imp正则表达式匹配的url有错误 for x in add: print ...
- Python学习教程:Python爬虫抓取技术的门道
Python学习教程:Python爬虫抓取技术的门道 web是一个开放的平台,这也奠定了web从90年代初诞生直至今日将近30年来蓬勃的发展.然而,正所谓成也萧何败也萧何,开放的特性.搜索引擎以及简单 ...
最新文章
- JVM源码分析之FinalReference完全解读
- 利用程序动态管理Web.config文件的配置
- 文本深度表示模型Word2Vec
- BF533和触摸屏接口芯片TSC2200调试日志
- 台式计算机风扇声音大怎么处理,如何解决电脑电源风扇声音大的问题?
- leetcode39. 组合总和(回溯)
- AndroidStudio安卓原生开发_Activity的启动模式部分singleTop启动模式和singleTask启动模式---Android原生开发工作笔记87
- 【Java从0到架构师】git 核心原理和分支管理
- 随机梯度下降法(SGD)
- 群晖使用ClouDNS免费DDNS解析
- 专业PE优盘启动制作工具 - 优启通
- gamit数据处理—5.遇到的问题
- 远程桌面连接:系统管理员已限制你登录的计算机处理方法
- Python数据分析案例篇(一)泰坦尼克号数据分析
- BFF —— Backend For Frontend
- 养兔子c语言sdut,SDUT 养兔子
- 关于trunk的几个端口模式
- eclipse配置glassfish插件和密码
- drools规则引擎并发结果不准确问题记录
- C#普通计算器与科学计算器
热门文章
- 赶集网MySQL开发36军规
- visual code php,vscode(Visual Studio Code)配置PHP开发环境的方法(已测)_编程开发_软件教程...
- spring boot-The temporary upload location [ ] is not valid
- 探测器反向偏压_科学网—《涨知识啦22》---MSM型光电探测器 - 寇建权的博文
- 重庆邮电大学计算机学院院徽,Slide计算机学院-重庆邮电大学.PPT
- element ui分页怎么做_Vue Element分页器
- 计算机工具软件应用考试,《计算机常用工具软件》期中考试题
- java doubke类型转换为String_Java基础知识面试题大集合
- 7z001怎么解压在安卓手机上面_安卓手机能打开eif文件吗 手机怎么打开eip文件方法...
- python3.4.4怎么用_python3.4使用文件