......失踪人口再次回归......

目的:爬取地理空间云数据中的“/数据资源/DEM数字高程数据/GDEMV2 30M 分辨率数字高程数据”,地理空间云数据的网址:http://www.gscloud.cn,要下载类型的数据约有2万多个。

结果呈现:下载zip文件

------------------------------华丽的分割线-----------------------------------

隔壁班的同学QQ小弹窗:“潘锁艳,你会爬虫?这个数据量太大,所以用手点不可能实现,你试一试?”

小潘同学心想:哈哈哈,终于能爬取个和自己专业(地理学)相关的网站了!

------------------------------华丽的分割线-----------------------------------

一开始想的太复杂,想在同学面前装×,打算利用session会话,先获取cookie,再找到验证码图片,再校验验证码,再校验邮箱密码,在获取csrftoken和utoken,再校验token值,登录成功之后,再访问要下载的页面。

嗯。一切都是为了装×,然后我就找验证码,找token值......但是被反爬了,IP被限制了,我又想到把之前的代理池拿过来用吧!

呵呵,越来越复杂了,有木有?我有没有很装×?!

不说了,上面这条装×的路,我选择放弃,一环套一环,心累......

然后我花了30分钟不到,写一个利用Selenium+Chrome的动态登录以及下载。嗯,超简单,都不用你操作啥,原理也超简单,就是根据xpath获得正确的标签,然后进行操作就可以了,果然不装×,才是王道!

#下面为本实例的爬虫代码,若有问题可以给我留言,或者有更好的解决方法也可以私信我~

from selenium import webdriver
import time
from selenium.webdriver.common.keys import Keysdriver=webdriver.Chrome(executable_path='C:\\Users\Administrator\Anaconda3\Scripts\chromedriver.exe')driver.get('https://www.gscloud.cn/accounts/login')email=driver.find_element_by_xpath('//*[@id="userid"]')
email.send_keys('你自己的账号')
password=driver.find_element_by_xpath('//*[@id="password"]')
password.send_keys('你自己的密码')
captcha=driver.find_element_by_xpath('//*[@id="id_captcha_1"]')
captcha_sj=input('请输入验证码:').strip()
captcha.send_keys(captcha_sj)dr_buttoon=driver.find_element_by_xpath('//*[@id="login-form"]/input[3]').click()
time.sleep(3)
sjzy=driver.find_element_by_xpath('/html/body/div[3]/div[3]/div[5]/a/h4').click()
time.sleep(3)
GDEMV30=driver.find_element_by_xpath('//*[@id="dataset-listview"]/div/div/ul/li[4]/div/a[3]').click()
time.sleep(3)#一共是2261页
page_num=2261
page=1
while page<=page_num:print('当前下载第{}页'.format(page))for tr_num in range(3,13): #只能取到3-12d_everypage='//*[@id="all_datasets_listview"]/div/table/tbody/tr['+str(tr_num)+']/td[9]/div/div/a[2]/span'download=driver.find_element_by_xpath(d_everypage).click()time.sleep(20)  #每个下载时间给20秒page += 1page_sr=driver.find_element_by_xpath('//*[@id="pager1"]/div[2]/table/tbody/tr/td[7]/input')page_sr.clear()page_sr.send_keys(page)page_sr.send_keys(Keys.RETURN)time.sleep(3)

结果:【还在下载呢。。。。。。毕竟2万多个dem数据,手点不累死你

---------(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)(。・ω・。)----------

今日爬虫完成!

今日鸡汤:没有人不辛苦,只有人不喊疼,真正坚强的人,会把哭声调成静音,会把委屈化成动力,一路披荆斩棘,坚强到无懈可击,勇敢到无畏无惧! 

加油ヾ(◍°∇°◍)ノ゙

转载于:https://my.oschina.net/pansy0425/blog/3050448

28-地理空间数据云下载相关推荐

  1. 从地理空间数据云下载数据后该如何操作

    首先,当然是要解压数据.以前上课的时候都是直接利用老师给我们发的实验数据,这次是期末论文考核,需要自己找数据,自己进行操作,浅浅记录以下我的学习过程吧. 当从地理空间数据云检索并下载完成数据后,我发现 ...

  2. DEM数据下载——以地理空间数据云为例

    数字高程模型(Digital Elevation Model)是进行地形分析的重要基础,诸如坡度.坡向及水文分析等都在此基础上进行.今天,我们一起来聊一聊一种DEM数据常见下载方式. 按照惯例,先将网 ...

  3. 如何用python批量下载数据_Python批量下载地理空间数据云数据!Python无所不能!...

    模拟登录 这里要用到两个包:requests和json.requests使用前得先安装:pip install requests. In [3]: 进群:548377875 即可获取数十套PDF哦! ...

  4. element 怎么把数据写到日历表上_数据集 | 地理空间数据云30m的DEM爬取

    DEM数据是我们经常用到的一种数据,小编今天就带大家一块看一下怎么用python来爬取地理空间数据云的30m的DEM数据. 我们要爬取DEM数据首先还是要有一个地理空间数据云的账号.小伙伴们如果没有的 ...

  5. 学习笔记——GEE\USGS\地理空间数据云\ENVI反复横跳的心酸过程

    整个问题实际上是在用GEE做无监督分类时,发现影像拼接色彩差距较大.出现明显拼接缝的问题,在尝试了网上已有的直方图匹配算法之后效果不佳且经常溢出,所以回归本心用ENVI去校正,试图获得色彩统一的整个影 ...

  6. 四维轻云地理空间数据云管理平台具有哪些优势?

    <四维轻云>是一款轻量化的地理空间数据管理云平台,支持多种地理空间数据的在线管理.编辑及分享.目前,平台有项目管理.数据上传.场景搭建.发布分享.素材库等功能模块,支持团队多用户在线协作管 ...

  7. 常用资源环境生态地理空间数据开源下载地址整理

    上学时研究需要用到大量资源环境生态地理空间数据,曾经搜集了不少资料,但开源的数据鱼龙混杂,参差不齐,数据筛选.验证和使用花费了不少时间,着实需要整理一下,在此记录一下已经整理过的数据!有需要的朋友可以 ...

  8. 地理空间数据云管理-四维轻云1.3.2-版本更新内容

    很多用户想要在不上传数据的情况下查看案例数据,我们在四维轻云1.3.2版本中为新用户新增了示例项目.此外,此次更新还新增了标绘数据模式和场景定时保存提醒功能,优化了插件启动流程以及移动和旋转变化轴. ...

  9. 遥感、地理空间数据、全国基础数据下载网站大全汇总

    本文收集整理了国内外常用的遥感.GNSS.地理空间数据下载网站,可以下载各种格式的矢量.栅格等数据,主要包括遥感影像.NDVI.太阳辐射.数字高程模型等各种地理空间数据,供GISer学习交流使用. 1 ...

  10. 利用python爬虫技术动态爬取地理空间数据云中的元数据(selenium)

    python爬取地理空间数据云selenium动态点击 爬取的网址秀一下: 爬取的信息是什么呢? 这个信息的爬取涉及到右边按钮的点击,这属于动态爬取的范畴,需要用到selenium 好了,那么开始写代 ...

最新文章

  1. 终端安全工具 gartner 排名
  2. string find()函数
  3. SqlBulkCopy批量复制数据
  4. 题目53:Goldbach's Conjecture
  5. celery-02-安装与使用说明-for-redis
  6. git 忽略文件提交的几种姿势
  7. 超详细的Engauge Digitizer 软件教程
  8. 成都青白江的羽毛球场地
  9. ToB 还是 ToC?
  10. Computer Networking——transport layer QA
  11. 陶博士-选股思路-如何应用月线反转
  12. 123457123457#0#-----com.yuming.TruckCarRun01--前拼后广--大卡车游戏cym
  13. noi linux黑屏,急!!!noi linux 安装后黑屏怎么处理?(xp系统)
  14. 网站搜索功能lucene
  15. 超能陆战队中的微型机器人现已实现!
  16. margin:0 auto是什么意思
  17. 2023年谷歌SEO购买外链必定指南,Google购买反向链接攻略
  18. ibm服务器安装ghostxp系统,windows xpsp3 ghost安装最实用的方法
  19. LeetCode每日一题,积少成多,量变到质变(最近比较忙不定期持续更新.........)
  20. 爬取去哪儿网酒店信息

热门文章

  1. 【算法】路径规划中的Dijkstra(狄克斯特拉)与A星算法
  2. 何凯明最新一作MAE解读系列2之代码实践
  3. 激光打标程序 c语言,激光打标机 - 20160516labview - 源码下载|Windows编程|其他小程序|源代码 - 源码中国...
  4. 骚操作“破解“App
  5. PDF如何转Excel?学会这3个方法,1分钟就能实现转换
  6. itextPDF生成表格的pdf
  7. matlab 音频fftshift,matlab使用杂谈5-fftshift函数的使用
  8. Smobiler的复杂控件的由来与创造
  9. 使用nginx + uwsgi部署自己的django项目
  10. ADMEMS 软件设计架构方法