Python —— 爬取成果微博相册图片 ——明星
爬取成果微博相册图片
采用了显示等待以及selenium模仿模拟器登陆微博
狗哥男粉飘过~~
本文采用的是模仿谷歌浏览器,使用ConfigParser读取自己的账号密码,通过找网页的xpath路径找到节点并点击登陆,想爬取哪个明星直接在get中覆盖
有时有额外验证码验证或滑块验证码的bug出现,这个后续补上自动验证
import requests
from selenium import webdriver # 自动化工具
from configparser import ConfigParser
import time
import re# 模仿浏览器 打开网址
driver = webdriver.Chrome()
driver.get("https://weibo.com/p/1005051927305954/photos?type=photo#_loginLayer_1579152333459")
driver.set_window_size(1200, 1000)
# 等待
driver.implicitly_wait(10)
time.sleep(3)
driver.find_element_by_link_text('登录').click()target = ConfigParser()
target.read('password.ini', encoding='utf-8')
password = target.get('weibo', 'password')driver.find_element_by_xpath("//div[@class = 'item username input_wrap']/input").send_keys()
driver.find_element_by_xpath("//div[@class = 'item password input_wrap']/input").send_keys(password)
driver.find_element_by_xpath("//div[@class = 'item verify']/../div[7]/a").click()for i in range(25):js = "var q = document.documentElement.scrollTop=" + str(i * 3000)driver.execute_script(js) # 执行time.sleep(3)def get_picture_url():page = driver.page_sourceprint(page)pictures_url = re.findall(r'class="photo_pict" src="//(.*?)"', page, re.S)num = 0# 下载图片for i in pictures_url:picture_url = 'http://' + ir = requests.get(picture_url)with open('ChengGuo/img%d.png' % num, 'wb') as f:f.write(r.content)num += 1get_picture_url()
# 解析数据
password.ini
[weibo]
username = "XXX"
password = XXX
运行结果–成果图
Python —— 爬取成果微博相册图片 ——明星相关推荐
- python爬取图片-Python爬取网页中的图片(搜狗图片)详解
前言 最近几天,研究了一下一直很好奇的爬虫算法.这里写一下最近几天的点点心得.下面进入正文: 你可能需要的工作环境: Python 3.6官网下载 本地下载 我们这里以sogou作为爬取的对象. 首先 ...
- Python 爬取陈都灵百度图片
Python 爬取陈都灵百度图片 标签(空格分隔): 随笔 今天意外发现了自己以前写的一篇爬虫脚本,爬取的是我的女神陈都灵,尝试运行了一下发现居然还能用.故把脚本贴出来分享一下. import req ...
- 用Python爬取彼岸图网图片
用Python爬取彼岸图网图片 *使用了 四个模块 import time import requests from lxml import etree import os 没有的话自行百度安装. ...
- python如何爬取网页视频_快就完事了!10分钟用python爬取网站视频和图片
原标题:快就完事了!10分钟用python爬取网站视频和图片 话不多说,直接开讲!教你如何用Python爬虫爬取各大网站视频和图片. 638855753 网站分析: 我们点视频按钮,可以看到的链接是: ...
- Python爬取国家地理杂志的图片
一.简介:Python爬取国家地理杂志的图片 二.代码展示 from bs4 import BeautifulSoup import requests import osos.mkdir('./img ...
- Python爬取 | 唯美女生图片
这里只是代码展示,且复制后不能直接运行,需要配置一些设置才行,具体请查看下方链接介绍: Python爬取 | 唯美女生图片 from selenium import webdriver from fa ...
- 利用python爬取qq个性网图片
利用python爬取qq个性网图片 网站头像布局大同小异,稍改代码即可爬取想要的头像. 不多bb,上代码. import requests from parsel import Selector im ...
- python爬取帖吧图片实验报告,Python爬取百度贴吧图片
原标题:Python爬取百度贴吧图片 作者:MTbaby 来源:http://blog.csdn.net/mtbaby/article/details/70209729 描述:用Python爬去百度贴 ...
- python爬取街拍美女图片
python爬取街拍美女图片 完整代码: import requests from urllib.parse import urlencode import os from hashlib impor ...
- python爬取4k小姐姐图片 人生苦短 我用python
4k壁纸它来了 前言 分析 代码 拼接每一页图片的路径 对每一页图片进行页面的解析,拿到图片详情页的url 拿到图片的url和图片名 线程池 多线程下载 总结 成果展示 老样子 先来几张图 前言 今天 ...
最新文章
- 高性能和可扩展的React-Redux
- activity的使用(八):生命周期
- c语言 显示 图形界面,「分享」C语言如何编写图形界面
- html5上传视频和预览,HTML5 上传前预览
- UVa10881 Piotr's Ants【模拟】
- 对于长期需要输出内容的来说,不管公域还是私-域
- linux安装redis 和 使用
- Spring Boot 如何极简入门?
- python做服务器需要什么模块_用Python自带的包建立简单的web服务器
- 刷题记录 kuangbin带你飞专题四:最短路练习
- win10打开视频显示HEVC视频扩展
- MySQL初步认实和搭建LAMP环境部署ucenter和ucenter-home
- STM32共阳数码管编程分享
- 知网文献免费下载方法
- 基于PT8.2网关的二氧化碳监测及联动控制
- Excel中随机六位字母与数字的密码
- python发送邮箱_利用Python自动发送电子邮件
- jdk1.8的下载与安装教程
- OrientDB部署
- C1-01基础任务和知识拓展
热门文章
- Error in *** : subscript out of bounds
- java 主动释放_java的手动释放资源
- transition动画无效 iphone6
- nginx实现ip138查询当前ip功能,配置文件实现接口
- DNS错误不能上网怎么办?电脑dns错误修复方法?
- 【MDCC 2016】信息无障碍专题沙龙现场实录 | 附PPT下载
- elite php,Elite Chat (开源在线客服系统)
- rstudio 连接mysql_Rstudio ODBC 连接MySQL
- 还在傻傻的数star、数fork吗?3秒钟教会你如何查看GitHub项目活跃度,是死是活一眼便知
- 计算机视觉——三维视觉III:立体视觉与三维建模