python爬虫 selenium+Autolt 实现IE网页中的文件下载
除了该方法,若可以知道下载网址,则只需直接 from urllib.request import urlopen打开网页下载即可。否则,还是需要Autolt来下载。下面为该种方法下载的过程。
Local $windHandle= WinGetHandle("[Class:IEFrame]", "")
Local $winTitle = "[HANDLE:" & $windHandle & "]"
WinActivate ($winTitle, "")
Send("{F6}")
sleep(500)
Send("{TAB}")
sleep(500)
Send("{DOWN}")
sleep(500)
Send("A")
; Save as dialog
; wait for Save As window
WinWait("另存为")
; activate Save As window
WinActivate("另存为")
ControlFocus("另存为","","ToolbarWindow324")
ControlClick("另存为","","ToolbarWindow324","left",1,300,10)
Sleep(2000)
Send($pathToSave)
Sleep(2000)
Send("{ENTER}")
Sleep(2000)
ControlClick("另存为","","Button2")
;===Execution of above code through selenium in python=====
import subprocess
import log
file_path='D:\work2017\file'
cmd='D:/work2017/Autolt/test.exe'+' '+file_path
p = subprocess.Popen(cmd, stdout=subprocess.PIPE, shell=True,
stderr=subprocess.PIPE)
out, err = p.communicate()
if p.returncode == 0:
print('ok')
python爬虫 selenium+Autolt 实现IE网页中的文件下载相关推荐
- 【音乐爬虫】Python爬虫-selenium+browsermob-proxy 解决动态网页 js渲染问题
1.一般的python爬虫很简单,直接请求对应网址,解析返回的数据即可,但是有很多网站的数据的js动态渲染的,你直接请求是得不到对应的数据的 这时就需要其它手段来处理了. 2.以一个例子来说明,整个过 ...
- [Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现访问Firefox浏览器并自动搜索"Eastmount"关键字及截图的功能.而这篇文章主要简单介绍如何实现自动登录163邮箱,同时 ...
- [python爬虫] Selenium常见元素定位方法和操作的学习介绍(转载)
转载地址:[python爬虫] Selenium常见元素定位方法和操作的学习介绍 一. 定位元素方法 官网地址:http://selenium-python.readthedocs.org/locat ...
- Python爬虫 Selenium实现自动登录163邮箱和Locating Elements介绍
Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门 https://item.taobao.com/item.htm?spm=a1z38n.10677092.0.0.482434a6E ...
- Python爬虫4.2 — ajax(动态网页数据抓取)用法教程
Python爬虫4.2 - ajax[动态网页数据]用法教程 综述 AJAX 介绍 什么是AJAX 实例说明 请求分析 获取方式 实例说明 其他博文链接 综述 本系列文档用于对Python爬虫技术的学 ...
- Python 爬虫 Selenium 基本使用
Python 爬虫 Selenium 基本使用 1. 基础知识 1.1 下载浏览器驱动 1.2 帮助文档 2. 浏览器操作 2.1 浏览器导航 2.2 窗口和选项卡 2.3 Frames and If ...
- Python爬虫-Selenium(1)
Python爬虫-Selenium(1) @(博客)[python, 爬虫, selenium, Python] Python爬虫-Selenium(1) 前言 前期准备 基础使用 进阶使用 浏览器操 ...
- [Python爬虫] Selenium实现自己主动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现訪问Firefox浏览器并自己主动搜索"Eastmount"keyword及截图的功能.而这篇文章主要简介怎样实现 ...
- python爬虫selenium爬不到frame 的tag标记下#document==0的内容解决
python爬虫selenium爬不到frame 的tag标记下#document==0的内容解决 前言 按理来说,selenium可以获取当前页面的所有源代码,但却爬不到frame 的tag标记下# ...
最新文章
- 芯片IP,SOC,FPGA智能卡
- 2014 Super Training #8 C An Easy Game --DP
- OGNL中的s:property /标签
- 1/1!-1/3!+1/5!-……
- 90.不用其它变量进行变量互换
- 【CodeForces - 675C】Money Transfers(思维,前缀和)
- js获取DIV的位置坐标的三种方法!
- android4.2 音频模块启动分析,Android 音频模块学习小结
- OC-内存管理的一些要点
- 硬件超车无法掩盖生态缺失,软实力构建任重而道远 | 中科曙光高性能计算专访...
- 音频系统POP音的原理和解决方法
- android 文件管理器
- ConvLSTM-AE for VAD (ICME2017-SIST)
- 大青云不显示服务器,《大青云》8月30日合服公告
- 数据分析常用知识体系
- 路飞学城Python-Day14
- 中国软件:10个人20年坎坷路
- ppt文件怎么转成pdf
- mysql索引怎么设计,MySQL如何设计索引
- 转载:看一遍就理解,图解单链表反转
热门文章
- 高危的程序猿,又被抓来顶缸了?光大证券“乌龙指”事件有感
- 如何安装鼠标微动的弹片
- 稻田香计算机毕业设计官网,稻田美术带您走进美术馆——广州美术学院毕业展 20170611...
- 微信扫一扫 Android 与 IOS 小区别
- 拿到阿里云服务器后的基本安全配置
- 【报告分享】2022春节档数据洞察-猫眼研究院(附下载)
- 【操作系统】模式切换篇
- java神剑30变_神剑养成(一) (MengSword1)
- flutter 自定义播放器进度条
- 什么硬件决定计算机运算速度,如何提高电脑运行速度,什么硬件决定电脑运行速度...