191029_中国地震局爬取
由于是国家网,有好多限制,首先要加User-Agent,之后用正则表达式经行爬取,好久没有用正则了,还是让老师帮忙的
import requests
import pandas as pd
from lxml import etree
import re
import json
num_mag=[]
orig_time=[]
latitudes=[]
longitudes=[]
depth=[]
epicenter=[]
for i in range(47,49):start_url='https://www.cea.gov.cn/eportal/ui?pageId=366509¤tPage={}'.format(i)print('保存第{0}页'.format(i))header = {'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'}response=requests.get(start_url,headers=header).content.decode()patten=re.compile('\[.*?\]',re.S)pic_list=re.findall(patten,response)diss_dict=json.loads(pic_list[0])for i in diss_dict:num_mag.append(i['num_mag'])#震级 orig_time.append(i['orig_time'])#发震时刻latitudes.append(i['latitudes'])#纬度longitudes.append(i['longitudes'])#经度try:if i['depth']:depth.append(i['depth'])except Exception as e:print(e)epicenter.append(i['epicenter'])#参考位置
data={'震级':num_mag,'发震时刻':orig_time,'纬度':latitudes,'深度':depth,'位置':epicenter,
}
df=pd.DataFrame(data)
代码还是有问题的,这样最后无法全部保存,还在修改中,如果有大佬看见这片文章,希望帮助下
191029_中国地震局爬取相关推荐
- 如何利用python的newspaper包快速爬取网页数据
文章目录 前言 一个爬取新闻网页数据的神器 小试牛刀 如何快速安装 windows安装 Debian / Ubuntu安装 OSX安装 体验更多的功能 前言 随着越来的进行自然语言处理相关方面的研究, ...
- python 爬取手机app的信息
我们在爬取手机APP上面的数据的时候,都会借助Fidder来爬取.今天就教大家如何爬取手机APP上面的数据. Python学习资料或者需要代码.视频加Python学习群:516107834 环境配置 ...
- Python爬取4399好wan的小游戏!
#coding=utf-8 #爬取4399所有好玩的游戏 import re import os import requests# 基础url host_url = 'http://www.4399. ...
- R 语言爬虫 之 cnblog博文爬取
Cnbolg Crawl a). 加载用到的R包 ##library packages needed in this case library(proto) library(gsubfn) ## Wa ...
- mysql 去重con_python 爬虫 实现增量去重和定时爬取实例
前言: 在爬虫过程中,我们可能需要重复的爬取同一个网站,为了避免重复的数据存入我们的数据库中 通过实现增量去重 去解决这一问题 本文还针对了那些需要实时更新的网站 增加了一个定时爬取的功能: 本文作者 ...
- java selenium_java+selenium,40行代码完成支付宝账单爬取
java+selenium,40行代码完成支付宝账单爬取 需要jar selenium-server-4.0.0-alpha-5.jar 需要驱动 chromedriver.exe 驱动需要和浏览器版 ...
- python爬虫抓取信息_python爬虫爬取网上药品信息并且存入数据库
我最近在学习python爬虫,然后正好碰上数据库课设,我就选了一个连锁药店的,所以就把网上的药品信息爬取了下来. 1,首先分析网页 2,我想要的是评论数比较多的,毕竟好东西大概是买的人多才好.然后你会 ...
- 加载多瓦片地图_手把手教 | 网络时空大数据爬取与分析DAS系统(瓦片地图获取)...
地理计算语言,为大众赋能地理智慧. --DAS Team 爬取分析DAS系统下载 地址:https://pan.baidu.com/s/1NkoyFhzMtm13ivlOOzukow 提取码:6ky8 ...
- python获取天气分析_Python爬取南京市往年天气预报,使用pyecharts进行分析
上一次分享了使用matplotlib对爬取的豆瓣书籍排行榜进行分析,但是发现python本身自带的这个绘图分析库还是有一些局限,绘图不够美观等,在网上搜索了一波,发现现在有很多的支持python的绘图 ...
- python获取登录按钮_python爬虫24 | 搞事情了,用 Appium 爬取你的微信朋友圈。
昨天小帅b看到一些事情不顺眼 有人偷换概念 忍不住就写了一篇反讽 996 的 看不下去了,我支持996,年轻人就该996! 没想到有些人看不懂 这就算了 还来骂我 早些时候关注我的小伙伴应该知道我第一 ...
最新文章
- 基于图形剪切的图像分割
- 准IT工作者如何择师、如何学习
- 深入redis内部--字典实现
- GIS数据的查找,插入,删除,更新(ArcEngine)
- ASP.NET Core 中的依赖注入
- Redis进阶之主从复制
- C++ - 类模板(class template) 详解 及 代码
- c/c++教程 - 2.4.2.7~8 类对象作为类成员,static静态成员变量函数
- 福州大学计算机学院软件实力,福建五大重点大学,哪一所实力最好?
- OpenCV 与 OpenGL 的关系是什么?
- 超效率dea matlab,MATLAB在超效率DEA模型中的应用研究
- Altium Designer封装库的绘制
- 游戏本天梯_天下3:夫妻采访——吃饭睡觉打天梯
- 数论基础——扩展欧几里得【详细】
- 最新版微信小程序如何引入iconfont阿里矢量图库解决方案
- 单片机音频谱曲软件_单片机谱曲软件怎么弄 51单片机蜂鸣器电子琴程序
- 2021年江苏省高考数据统计:江苏省普通类报名人数30.9万人,本土167所高校(2所985大学)
- Java内存模型中happen-before原则
- ext表格内容自动换行
- 最简解决方案--安装ubuntu 遇到32位 EFI(UEFI) /EFI/BOOT/bootia32.efi unavilable
热门文章
- Qweb Pdf 中添加 图片
- [小明带你玩儿Photon]5.服务器与客户端架构
- cake 简单思维题
- 一步步学习SPD2010--第十四章节--在Web页面使用控件(2)--使用标准ASP.NET服务器控件...
- SharePoint 2013 中的新增功能(与开发有关)
- ASP.NET站点性能提升-缩短首页生成时间
- 【c++】指针常量与常量指针
- 浏览器的控制台-----后期更新
- python之logging模块简单用法
- 【百度地图API】情人节求爱大作战——添加标注功能