from selenium import webdriver

import time

import re

import random

browser=webdriver.Firefox()

browser.get("http://3g.kaixin001.com/")

browser.find_element_by_id("username").send_keys("登陆账号")

browser.find_element_by_id("password").send_keys("密码")

browser.find_element_by_name("login").click()#输入账号密码,点击登录按钮登录

browser.find_element_by_class_name("name").click()

time.sleep(random.randint(2,8))

browser.find_element_by_link_text("我的照片(37)").click()  #照片相册名字

time.sleep(random.randint(2,8))

browser.find_element_by_class_name("pic_container").click()#默认使用class name定位仅可以定位带第一个照片专辑,使用xpath或link txt定位可定位其他照片专辑

time.sleep(random.randint(2,8))

browser.find_element_by_xpath("/html/body/div[7]/a[1]").click()

html=browser.page_source

yeshu=browser.find_element_by_class_name("c9").text#确定当前专辑有几张照片,为下面的循环做准备

yeshu2=int(yeshu[3:5])

f=open("123.txt","a+")

if yeshu2>0:

for i in range(0,yeshu2):#确定照片张数之后循环指定次数,获取图片地址,依次下一张

i-=1

html1=browser.page_source

htmlimg=re.findall("下载中(.*)下载原图",html1,re.S)

strli="".join(htmlimg)  #列表转换为字符串

print(strli)

f.write(strli)

time.sleep(random.randint(2,8))

browser.find_element_by_link_text("下一张").click()

f.close()

python调用selenium实现登陆开心网,下载指定专辑内的照片。整个过程调用火狐浏览器实现,可看到每一步的操作步骤。过程中遇到一些问题总结如下:

1.selenium定位元素时有时使用常规的id,name,class name,等方式都无法定位时,可以考虑使用xpath实现定位。比如某些元素属性都一致的时候。或者使用link txt定位

2.random模块可以实现随机数功能,简单好用,很强大。

3.strli="".join(htmlimg)    列表转换为字符串,列表之间的内容用“”之间的内容进行连接。对应的是aplit,用法如下

split(…)

S.split([sep [,maxsplit]]) -> 由字符串分割成的列表

返回一组使用分隔符(sep)分割字符串形成的列表。如果指定最大分割数,则在最大分割时结束。如果分隔符未指定或者为none,则分隔符默认为空格。

python selenium下载图片_python 登陆开心网图片批量下载-selenium实现相关推荐

  1. python 批量下载网址_python 遍历oss 实现批量下载

    oss存储有很多批量上传的文  = = 然后现在是由于程序主动删除了oss的文件,阿里是不给恢复的,所以想要把文件备份到本地 . 阿里的oss是key-values形式的存储,没有文件夹的概念,也是就 ...

  2. python网上批量下载表格_python读取表格链接批量下载Html文件

    #导入库 import urllib.request #获取单个html文件内容 def getHtml(url): html=urllib.request.urlopen(url).read() r ...

  3. python批量下载网页文件夹_Python抓取网页批量下载文件方法初探(正则表达式+BeautifulSoup) (转)...

    最近两周都在学习Python抓取网页方法,任务是批量下载网站上的文件.对于一个刚刚入门python的人来说,在很多细节上都有需要注意的地方,以下就分享一下我在初学python过程中遇到的问题及解决方法 ...

  4. python 登陆开心网图片批量下载-selenium实现

    from selenium import webdriver import time import re import randombrowser=webdriver.Firefox() browse ...

  5. python抓取图片数字_python 实现识别图片上的数字

    Python 3.6 版本 Pytesseract 图像验证码识别 环境: (1) win7 64位 (2) Idea (3) python 3.6 (4) pip install pillow &l ...

  6. python 过滤相似图片_Python过滤纯色图片,挑选视频封面

    截取视频封面后,经常出现全黑.全白等不可用的封面图片.于是就有了用程序选择视频封面的需求. 经过不断试验,效果最好的方法是根据图片内物品的数量来选图. 废话不多说,直接上代码: 1. 把图片处理为灰度 ...

  7. python抓取图片数字_Python提取数字图片特征向量 | kTWO-个人博客

    引言 在机器学习中有一种学习叫做手写数字识别,其主要功能就是让机器识别出图片中的数字,其步骤主要包括:图片特征提取.将特征值点阵转化为特征向量.进行模型训练.第一步便是提取图片中的特征提取.数据的预处 ...

  8. 实战python网络爬虫脚本之家_python爬虫实战,批量下载网站视频

    pip3 install requests 测试样例 加上序言总共有16个视频,我们用python爬虫技术批量下载到本地. https://learning.dcloud.io/#/?vid=0 ​ ...

  9. python 批量下载依赖_python通过txt文件批量安装依赖包的实现步骤

    python通过txt文件批量安装依赖包的实现步骤 如果要用某个开源框架,需要安装多个依赖包可以如下操作: 如依赖文件形式如下(可以不要版本号): txt文件名为requirements.txt,内容 ...

  10. python目录名称无效_python - NotADirectoryError:[WinError 267]通过Selenium Python调用Firefox时目录名称无效错误...

    我正试图从下面的python代码调用使用Selenium webdriver的firefox浏览器..from selenium import webdriver # Initializing the ...

最新文章

  1. 实践|超简单实现OCR文字识别应用
  2. Python开发基础总结之函数+闭包+字典+列表
  3. python与rpc服务
  4. JavaScript 中实现 sleep
  5. php日期差数,php如何计算日期差几天
  6. find命令过滤 no such_linux find -exec rm -r 报No such file or directory
  7. 南京邮电大学java程序设计作业在线编程第二次作业
  8. oracle设置no null,Oracle 在not in中使用null的问题
  9. 解析接口中的JSON数据
  10. Error response from daemon: OCI runtime exec failed: exec failed: container_linux.go:345:
  11. Hadoop组件概览
  12. MP3播放(javazoom.jl.player.Player)
  13. python 单词发音-[Python]通过有道词典API获取单词发音MP3
  14. 103.219.29杭州DNS常见的的5个网络安全威胁
  15. 解决:Notepad++搜索不到(无法安装)Finger Text插件
  16. 记一次bash脚本报错原因
  17. Linux调度器笔记
  18. 硕士研究生毕业论文检测加强通过率的四大方法
  19. LruCache算法原理解析
  20. 如何判断一个点在矩形或多边形内

热门文章

  1. 20003.数据结构C++ 顺序表
  2. 硬盘格式化工具 标记坏扇区_硬盘格式化后是否还记得坏扇区?
  3. leetcode刷题之x的算术平方根
  4. java公告栏源码_公告栏view
  5. 新塘单片机烧写器_新唐单片机烧录工具-Nuvoton ICP Programming Tool下载v3.00.6909官方免费版-ucbug下载站...
  6. 确定性知识表示法--规则(产生式)表示法
  7. 反激电源电路电磁干扰抑制措施
  8. 恶梦----------需求分析的漫延
  9. 【服务器数据恢复】服务器重启后掉线硬盘重新上线同步数据被中断后数据丢失的数据恢复案例
  10. win10 ie设置不了代理服务器