利用selenium实现中国裁判文书网自动登录批量下载功能

本代码只用于学习,请遵守相关法律法规,请勿售卖未经授权的数据。
爬虫者请牢记。

直接上代码了,挺简单的。

# -*- coding:utf-8 -*-
from selenium import webdriver
from selenium.webdriver.support.select import Select
from selenium.webdriver.common.keys import Keys
import time# 初始化selenium
option = webdriver.ChromeOptions()
option.add_argument('--start-maximized')
option.add_experimental_option('excludeSwitches', ['enable-automation'])
prefs = {'profile.default_content_settings.popups': 0, 'download.default_directory': 'D:\\裁判文书网\\',"profile.default_content_setting_values.automatic_downloads":1}
option.add_experimental_option('prefs', prefs)driver = webdriver.Chrome('chromedriver_win32/chromedriver.exe',options=option)driver.maximize_window()
driver.set_page_load_timeout(30)url = 'https://wenshu.court.gov.cn/website/wenshu/181029CR4M5A62CH/index.html?'
driver.get(url)#  —————— 登录 ————————
# 进入登录页面
driver.find_element_by_xpath('//*[@id="loginLi"]/a').click()
text = driver.page_sourcetime.sleep(10)  # 等待页面渲染# 自动登录
# 进入iframe框
iframe = driver.find_elements_by_tag_name('iframe')[0]
driver.switch_to.frame(iframe)username = driver.find_element_by_xpath('/html/body/app-root/div/app-login/div/div/form/div/div[1]/app-mobile-input/div/input')username.send_keys('账号')time.sleep(3)username = driver.find_element_by_xpath('/html/body/app-root/div/app-login/div/div/form/div/div[2]/input')username.send_keys('密码')time.sleep(2)driver.find_element_by_xpath('/html/body/app-root/div/app-login/div/div/div[2]/button').click()time.sleep(3)
# —————— 登录成功 ————————driver.find_element_by_xpath('//*[@id="_view_1540966819000"]/div/ul/li[2]/a').click()time.sleep(10)
# testHtml(driver.page_source)_lastWindow = driver.window_handles[-1]
driver.switch_to.window(_lastWindow)s1 = Select(driver.find_element_by_xpath('//*[@id="_view_1545184311000"]/div[8]/div/select'))
s1.select_by_visible_text('15')page = 1
while page < 4:time.sleep(1)# 点击批量下载driver.find_element_by_xpath('//*[@id="AllSelect"]').send_keys(Keys.SPACE)time.sleep(3)driver.find_element_by_xpath('//*[@id="_view_1545184311000"]/div[2]/div[4]/a[3]').click()time.sleep(3)# 下一页driver.find_element_by_xpath('//*[@id="_view_1545184311000"]/div[18]/a[8]').click()page += 1driver.quit()
  • 2021.02.02更
    关注公众号回复【文书网爬虫】,即可下载最新的文书网爬虫。

利用selenium实现中国裁判文书网自动登录批量下载功能相关推荐

  1. 一周内自动登录php,利用php实现一周之内自动登录存储机制(cookie、session、localStorage)...

    cookie.session.localStorage这三个应该是最让程序员头疼的了,我利用简单的登录界面的username和password来说明一下吧. 1.cookie用来存储用户相关数据,存储 ...

  2. Python + Selenium实现163邮箱的自动登录和发送邮件

    运用Python和Selenium实现163邮箱的自动登录和发送邮件 初接触selenium,最近研究了一下用python和Selenium实现163邮箱的自动登录和发送邮件的实现过程,中间出现了各种 ...

  3. 中国电信数字中南智慧网自动登录油猴脚本

    中国电信数字中南智慧网自动登录油猴脚本 每次登陆校园网都要输入账号密码再点登陆,于是想自己编写一个油猴脚本自动登录.今天花了半个小时把脚本做出来了,写一篇教程帮助大家. 首先在浏览器上安装油猴插件,推 ...

  4. Python中国裁判文书网

    一:介绍 中国裁判文书网(http://wenshu.court.gov.cn/)是中国司法部门的官方网站,提供全国各级法院的裁判文书和审判流程信息. 二:数据获取

  5. 中国裁判文书网----最最最详细爬虫----基于各位大佬的帖子---更新一版----步骤不详细?你打死我 本爬虫编写日期:2019-07-30

    目录 一.吐槽 二.参考 三.爬取目标以及爬取思路 1.爬取目标 2.爬取思路 四.破解(重头戏) 1.发现加密参数得过程 1.1 暴力请求 案件详情页 2.破解案件列表页请求参数 2.1 解密num ...

  6. Scrapy框架爬取中国裁判文书网案件数据

    Scrapy框架爬取中国裁判文书网案件数据 项目Github地址: https://github.com/Henryhaohao/Wenshu_Spider 中国裁判文书网 - http://wens ...

  7. python脚本自动qq签到_Python爬虫实现自动登录、签到功能 附代码

    这篇文章主要介绍了Python爬虫实现自动登录.签到功能的代码,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下 前几天在一个素材网站上下载东 ...

  8. 网易云音乐批量下载器v1.1软件介绍(修正版)

    网易云音乐批量下载器简介 网易云音乐批量下载器v1.1 软件介绍 1.编写初衷 2.界面展示 3.使用方法 如何获取cookie? 4.其他说明 5.下载地址 网易云音乐批量下载器v1.1 软件介绍 ...

  9. python远程同步文件_Python实现的远程文件自动打包并下载功能示例

    Python实现的远程文件自动打包并下载功能示例 发布时间:2020-08-19 23:32:33 来源:脚本之家 阅读:103 本文实例讲述了Python实现的远程文件自动打包并下载功能.分享给大家 ...

  10. 如何免登录批量下载特定用户的微博高清大图?

    早年人人还有这个功能:批量下载某个用户的所有图片,而且都是高清大图.但是到了微博,官方似乎没有这项功能,难道需要一张张右键另存为?这里有个java程序可以解决你的问题. git clone https ...

最新文章

  1. dataframe多列合并成一列
  2. 数控机床编程用c语言,基于C语言数控机床智能后置处理程序的制作-(1).pdf
  3. weave实现宿主机之间的容器互联
  4. module_init和init_module的区别
  5. 如何对比_潭酒红潭酱酒对比红花郎怎么样口感如何
  6. 多线程:AQS源码分析
  7. Visual C++下对匿名管道的编程实现
  8. DRF的序列化——Serializers 序列化组件
  9. GB2312 UTF8 UCS2汉字编码对应表
  10. 从新获取jar_hadoop3.0新特性总结
  11. 【java】JDK安全模块JCE核心Cipher使用详解
  12. 使用 webSocket 连接菜鸟打印(并获取当前电脑连接的打印机信息)
  13. GAN:两者分布不重合JS散度为log2的数学证明
  14. 微型计算机自动化控制专业,自动化专业简介
  15. 利用python编写个性二维码制作工具(支持微信名片二维码),并打包成EXE可执行文件。——001
  16. js实现网页在线聊天功能(四)
  17. 百度程序员删库跑路被逮捕!
  18. 100部经典中国电影,你看过几部?
  19. 串口转以太网服务器原理,【干货】自制低成本串口转以太网网关
  20. 如何打开计算机任务管理器,电脑任务管理器怎么打开

热门文章

  1. 混沌图像---陈氏吸引子的飞蛾
  2. html子布局不超出父布局,flex布局子元素超出父元素
  3. 电脑如何显示文件后缀名
  4. 记账小程序 微信小程序 源码 uniapp vue3
  5. 世界银行的WDI世界发展指标数据EXCEL版本(1960-2017年)
  6. 查找销售模块中装箱单提单主提单当前的编号
  7. 大学计算机案例教程旧照片修复,「教你一招」使用自动软件修复老照片
  8. Word2019添加复选框
  9. 交换机端口vlan tag/untag处理情况
  10. Linux常用基本命令详解(三)