28-地理空间数据云下载
......失踪人口再次回归......
目的:爬取地理空间云数据中的“/数据资源/DEM数字高程数据/GDEMV2 30M 分辨率数字高程数据”,地理空间云数据的网址:http://www.gscloud.cn,要下载类型的数据约有2万多个。
结果呈现:下载zip文件
------------------------------华丽的分割线-----------------------------------
隔壁班的同学QQ小弹窗:“潘锁艳,你会爬虫?这个数据量太大,所以用手点不可能实现,你试一试?”
小潘同学心想:哈哈哈,终于能爬取个和自己专业(地理学)相关的网站了!
------------------------------华丽的分割线-----------------------------------
一开始想的太复杂,想在同学面前装×,打算利用session会话,先获取cookie,再找到验证码图片,再校验验证码,再校验邮箱密码,在获取csrftoken和utoken,再校验token值,登录成功之后,再访问要下载的页面。
嗯。一切都是为了装×,然后我就找验证码,找token值......但是被反爬了,IP被限制了,我又想到把之前的代理池拿过来用吧!
呵呵,越来越复杂了,有木有?我有没有很装×?!
不说了,上面这条装×的路,我选择放弃,一环套一环,心累......
然后我花了30分钟不到,写一个利用Selenium+Chrome的动态登录以及下载。嗯,超简单,都不用你操作啥,原理也超简单,就是根据xpath获得正确的标签,然后进行操作就可以了,果然不装×,才是王道!
#下面为本实例的爬虫代码,若有问题可以给我留言,或者有更好的解决方法也可以私信我~
from selenium import webdriver import time from selenium.webdriver.common.keys import Keysdriver=webdriver.Chrome(executable_path='C:\\Users\Administrator\Anaconda3\Scripts\chromedriver.exe')driver.get('https://www.gscloud.cn/accounts/login')email=driver.find_element_by_xpath('//*[@id="userid"]') email.send_keys('你自己的账号') password=driver.find_element_by_xpath('//*[@id="password"]') password.send_keys('你自己的密码') captcha=driver.find_element_by_xpath('//*[@id="id_captcha_1"]') captcha_sj=input('请输入验证码:').strip() captcha.send_keys(captcha_sj)dr_buttoon=driver.find_element_by_xpath('//*[@id="login-form"]/input[3]').click() time.sleep(3) sjzy=driver.find_element_by_xpath('/html/body/div[3]/div[3]/div[5]/a/h4').click() time.sleep(3) GDEMV30=driver.find_element_by_xpath('//*[@id="dataset-listview"]/div/div/ul/li[4]/div/a[3]').click() time.sleep(3)#一共是2261页 page_num=2261 page=1 while page<=page_num:print('当前下载第{}页'.format(page))for tr_num in range(3,13): #只能取到3-12d_everypage='//*[@id="all_datasets_listview"]/div/table/tbody/tr['+str(tr_num)+']/td[9]/div/div/a[2]/span'download=driver.find_element_by_xpath(d_everypage).click()time.sleep(20) #每个下载时间给20秒page += 1page_sr=driver.find_element_by_xpath('//*[@id="pager1"]/div[2]/table/tbody/tr/td[7]/input')page_sr.clear()page_sr.send_keys(page)page_sr.send_keys(Keys.RETURN)time.sleep(3)
结果:【还在下载呢。。。。。。毕竟2万多个dem数据,手点不累死你】
---------(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)----------
今日爬虫完成!
今日鸡汤:没有人不辛苦,只有人不喊疼,真正坚强的人,会把哭声调成静音,会把委屈化成动力,一路披荆斩棘,坚强到无懈可击,勇敢到无畏无惧!
加油ヾ(◍°∇°◍)ノ゙
转载于:https://my.oschina.net/pansy0425/blog/3050448
28-地理空间数据云下载相关推荐
- 从地理空间数据云下载数据后该如何操作
首先,当然是要解压数据.以前上课的时候都是直接利用老师给我们发的实验数据,这次是期末论文考核,需要自己找数据,自己进行操作,浅浅记录以下我的学习过程吧. 当从地理空间数据云检索并下载完成数据后,我发现 ...
- DEM数据下载——以地理空间数据云为例
数字高程模型(Digital Elevation Model)是进行地形分析的重要基础,诸如坡度.坡向及水文分析等都在此基础上进行.今天,我们一起来聊一聊一种DEM数据常见下载方式. 按照惯例,先将网 ...
- 如何用python批量下载数据_Python批量下载地理空间数据云数据!Python无所不能!...
模拟登录 这里要用到两个包:requests和json.requests使用前得先安装:pip install requests. In [3]: 进群:548377875 即可获取数十套PDF哦! ...
- element 怎么把数据写到日历表上_数据集 | 地理空间数据云30m的DEM爬取
DEM数据是我们经常用到的一种数据,小编今天就带大家一块看一下怎么用python来爬取地理空间数据云的30m的DEM数据. 我们要爬取DEM数据首先还是要有一个地理空间数据云的账号.小伙伴们如果没有的 ...
- 学习笔记——GEE\USGS\地理空间数据云\ENVI反复横跳的心酸过程
整个问题实际上是在用GEE做无监督分类时,发现影像拼接色彩差距较大.出现明显拼接缝的问题,在尝试了网上已有的直方图匹配算法之后效果不佳且经常溢出,所以回归本心用ENVI去校正,试图获得色彩统一的整个影 ...
- 四维轻云地理空间数据云管理平台具有哪些优势?
<四维轻云>是一款轻量化的地理空间数据管理云平台,支持多种地理空间数据的在线管理.编辑及分享.目前,平台有项目管理.数据上传.场景搭建.发布分享.素材库等功能模块,支持团队多用户在线协作管 ...
- 常用资源环境生态地理空间数据开源下载地址整理
上学时研究需要用到大量资源环境生态地理空间数据,曾经搜集了不少资料,但开源的数据鱼龙混杂,参差不齐,数据筛选.验证和使用花费了不少时间,着实需要整理一下,在此记录一下已经整理过的数据!有需要的朋友可以 ...
- 地理空间数据云管理-四维轻云1.3.2-版本更新内容
很多用户想要在不上传数据的情况下查看案例数据,我们在四维轻云1.3.2版本中为新用户新增了示例项目.此外,此次更新还新增了标绘数据模式和场景定时保存提醒功能,优化了插件启动流程以及移动和旋转变化轴. ...
- 遥感、地理空间数据、全国基础数据下载网站大全汇总
本文收集整理了国内外常用的遥感.GNSS.地理空间数据下载网站,可以下载各种格式的矢量.栅格等数据,主要包括遥感影像.NDVI.太阳辐射.数字高程模型等各种地理空间数据,供GISer学习交流使用. 1 ...
- 利用python爬虫技术动态爬取地理空间数据云中的元数据(selenium)
python爬取地理空间数据云selenium动态点击 爬取的网址秀一下: 爬取的信息是什么呢? 这个信息的爬取涉及到右边按钮的点击,这属于动态爬取的范畴,需要用到selenium 好了,那么开始写代 ...
最新文章
- 终端安全工具 gartner 排名
- string find()函数
- SqlBulkCopy批量复制数据
- 题目53:Goldbach's Conjecture
- celery-02-安装与使用说明-for-redis
- git 忽略文件提交的几种姿势
- 超详细的Engauge Digitizer 软件教程
- 成都青白江的羽毛球场地
- ToB 还是 ToC?
- Computer Networking——transport layer QA
- 陶博士-选股思路-如何应用月线反转
- 123457123457#0#-----com.yuming.TruckCarRun01--前拼后广--大卡车游戏cym
- noi linux黑屏,急!!!noi linux 安装后黑屏怎么处理?(xp系统)
- 网站搜索功能lucene
- 超能陆战队中的微型机器人现已实现!
- margin:0 auto是什么意思
- 2023年谷歌SEO购买外链必定指南,Google购买反向链接攻略
- ibm服务器安装ghostxp系统,windows xpsp3 ghost安装最实用的方法
- LeetCode每日一题,积少成多,量变到质变(最近比较忙不定期持续更新.........)
- 爬取去哪儿网酒店信息
热门文章
- 【算法】路径规划中的Dijkstra(狄克斯特拉)与A星算法
- 何凯明最新一作MAE解读系列2之代码实践
- 激光打标程序 c语言,激光打标机 - 20160516labview - 源码下载|Windows编程|其他小程序|源代码 - 源码中国...
- 骚操作“破解“App
- PDF如何转Excel?学会这3个方法,1分钟就能实现转换
- itextPDF生成表格的pdf
- matlab 音频fftshift,matlab使用杂谈5-fftshift函数的使用
- Smobiler的复杂控件的由来与创造
- 使用nginx + uwsgi部署自己的django项目
- ADMEMS 软件设计架构方法