python输入三行数据_3行Python代码就能获取海量数据?
原标题:3行Python代码就能获取海量数据?
一谈起数据分析,首先想到的就是数据,没有数据,谈何分析。
毕竟好的菜肴,没有好的原材料,是很难做的~
所以本期小F就给大家分享一个获取数据的方法,只需三行代码就能搞定。
「GoPUP」,大佬造的轮子,大概有100+的免费数据接口。
GitHub:https://github.com/justinzm/gopup
使用文档:http://doc.gopup.cn/#/README
主要有指数数据、宏观经济数据、新经济数据、微博KOL数据、信息数据、生活数据、疫情数据等。
# 安装gopup
pip install gopup --upgrade
安装成功后,就能使用了。
01 微博指数
获取指定关键词的微博指数。
# 微博指数
importgopup asgp
df_index = gp.weibo_index(word= "马保国", time_type= "1month")
print(df_index)
time_type="1month"; 1hour, 1day, 1month, 3month 选其一。
三行Python代码实现数据获取。
02 百度指数
获取指定关键词的百度搜索指数。
# 百度指数
importgopup asgp
cookie = "此处输入您在网页端登录百度指数后的 cookie 数据"
index_df = gp.baidu_search_index(word= "马保国", start_date= '2020-11-15', end_date= '2020-11-25', cookie=cookie)
print(index_df)
需要登陆百度指数,获取你的Cookie。
设置关键词,时间起始,就能获取到马保国老师的热度数据了。
后面还有百度资讯、媒体、需求图谱、人群年龄、性别、兴趣分布数据接口,就不一一介绍了。
感兴趣的同学可以自行去查看文档。
03 头条指数
获取指定关键词的头条指数。
接口挂了,不知为何~
还有相关性、情感、地域、城市、年龄、性别、用户阅读兴趣分析数据等接口。
04 谷歌数据
需要通过代理才能使用,不过上面这三类已经完全够用了。
# 谷歌数据
importgopup asgp
index_df = gp.google_index(keyword= "马保国", start_date= '2020-11-15T10', end_date= '2020-11-25T23')
print(index_df)
05 宏观经济数据
有一个杠杆率的数据可以使用。
# 杠杆数据
importgopup asgp
df_index = gp.marco_cmlrd
print(df_index)
不懂经济学,所以不明觉厉。
06 新经济数据
这个数据倒是蛮有趣的,主要是公司数据。
比如独角兽和倒闭公司的数据。
# 独角兽公司数据
importgopup asgp
df_index = gp.nicorn_company
print(df_index)
一共是240家独角兽公司。
蚂蚁、字节、阿里云、滴滴,都是行业中的大佬。
# 倒闭公司数据
importgopup asgp
df_index = gp.death_company
print(df_index)
倒闭的公司一共有6921家。
看到不少P2P的公司。
剩下还有有一个特许经营许可数据,好像是吊牌销售的意思。
前段时间看到一篇文章,讲的就是南极人吊牌销售的事情,南极人都不自己搞生产,而是代工。
07 KOL数据&信息数据
主要是微博的KOL,所以没啥用。
# KOL数据
importgopup asgp
g = gp.pro_api(token = "……")
df_index = g.weibo_user(keyword= "雷军")
print(df_index)
信息数据是新闻联播文字稿。
08 中国油价数据
包含汽油和柴油的调价信息数据。
# 油价数据
importgopup asgp
df_index = gp.energy_oil_hist
print(df_index)
时间从2000年直到2020年,细数20年油价变化。
09 百度迁徙数据
可以用来做飞线图或者OD图。
单次返回100个城市的数据。
10 影视数据
实时电影票房数据,最近又有病例出现,数据应该也比较惨淡。
这里需要一个WebDES.js文件,才能请求成功。
# 实时电影票房数据
importgopup asgp
df_index = gp.realtime_boxoffice
print(df_index)
「如果声音不记得」当日1千万的票房,太少了。
单日影院数据,今年影院能倒闭一大堆。
# 单日影院数据
importgopup asgp
df_index = gp.day_cinema(date= "2020-12-08")
print(df_index)
得到票房前100的数据。
最高应该是8万多的收入。
实时电视剧播映指数,天气冷了选个好剧或者综艺,窝在被窝刷起来。
# 电视剧数据
importgopup asgp
df_index = gp.realtime_tv
print(df_index)
大秦赋,小F也在看,感觉还不错。
还有实时综艺播映指数、艺人商业价值、流量价值等数据。
11 全国高等学校数据
普通高等学校名单,包含名称、主管部门,所在省市、所在地、办学层次等信息。
# 普通高等学校数据
importgopup asgp
df_index = gp.university
print(df_index)
一共是2631所高校。
还有成人高等学校以及高等学校详情数据。
有网易、丁香园、百度三家的疫情数据。
# 世界历史累计确诊数据
importgopup asgp
covid_163_df = gp.covid_163(indicator= "世界历史累计数据")
print(covid_163_df)
目前累计207个国家有疫情出现。
全世界总共就233个国家和地区,快接近90%了。
由于数据接口太多了,小F就不一一介绍了。
查看文档: http://doc.gopup.cn/#/data/index_data返回搜狐,查看更多
责任编辑:
python输入三行数据_3行Python代码就能获取海量数据?相关推荐
- python自动修图软件_3 行 Python 代码实现 5 秒抠图的 AI 神器,告别PS(附教程)...
文 | 苏克 1900@高级农名工 推荐 | 编程派公众号(ID:codingpy) 曾几何时,「抠图」是一个难度系数想当高的活儿,但今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度 ...
- python开发ps插件_3 行 Python 代码实现 5 秒抠图的 AI 神器,告别PS(附教程)
文 | 苏克 1900@高级农名工 推荐 | 编程派公众号(ID:codingpy) 曾几何时,「抠图」是一个难度系数想当高的活儿,但今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度 ...
- python怎么换背景_3行Python代码实现图像照片抠图和换底色的方法
1.项目背景 对于不会PS的小伙伴,抠图是一个难度系数想当高的活儿,某宝照片抠图和证件照换底色均价都是5元RMB,所以今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度抠图,甚至都不用 ...
- python数组合并、输入三行数据,如何在python中合并两个或三个3D数组?
Numpy的hstack.vstack或dstack(取决于要连接数组的轴)将连接多维数组.在 请注意,对于MODIS气溶胶数据,使用hstack连接阵列有时会抛出错误,因为有时阵列是203 x 13 ...
- python输入逗号分隔_命令行Python逗号分隔的用户输入int值
"2,3"是一个字符串,将其传递给函数不会使其表现为由,分隔的两个不同参数(如您所料).在>>> def func(arg): ... print arg ... ...
- python读取文件第n行-Python读取文件后n行的代码示例
这篇文章主要介绍了Python实现读取文件最后n行的方法,涉及Python针对文件的读取.遍历与运算相关操作技巧,需要的朋友可以参考下# -*- coding:utf8-*- import os im ...
- python自动化--如何用10行Python代码调一个闹钟 #电脑调闹钟
python自动化--如何用10行Python代码写一个闹钟 前言: 文末彩蛋--轻松一刻 更多关于Python的知识请加关注哟~~.若需联系博主请私信或者加博主联系方式: QQ:1542 ...
- 代码 抠图_3 行 Python 代码 5 秒抠图的 AI 神器,根本无需 PS,附教程
曾几何时,「抠图」是一个难度系数想当高的活儿,但今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度抠图,甚至都不用会代码,点两下鼠标就完成了. 感受下这款抠图工具抠地有多精细: 是不是 ...
- 代码 抠图_3 行 Python 代码 5 秒抠图的 AI 神器,根本无需 PS
文 | 苏克 1900@高级农名工 推荐 | 编程派公众号(ID:codingpy) 曾几何时,「抠图」是一个难度系数想当高的活儿,但今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度 ...
最新文章
- java map深拷贝_java 实现Map的深复制
- 关于C#中编译器保证变量必须初始化规则猜想
- C/C++从源代码到生成可执行程序的过程详解!
- 二进制包方式安装部署三节点k8s
- 一块移动硬盘怎样兼容Mac和Windows系统,并且可以在time machine上使用
- PO、VO、POJO、DTO、DAO、Service包等常见包的理解
- ES07--性能调优03(全面考量)
- 运用ECharts展示股票k线图
- 项目管理知识体系指南 PMBOK(第6版)十大知识领域思维导图(总览图)
- Speedoffice(excel)如何自动换行
- RHEL5 Oracle 11G R2 RAC 静默安装 (三) rdbms安装 dbca 建库
- 如何使html中的图片居中
- 关于ant design pro中2个下拉列表,下列列表a的数据需要依据列表b选择的值来进行变化,无法及时获取
- html设置自动切图指定位置,HTML5自助切图
- Servlet 03
- RabbitMQ从入门到实践
- vue 路由history模式打包部署 The requested URL * was not found on this server. 的解决方法
- python之xlrd
- 【色彩管理】YIQ色彩模式详解
- C语言编程练习 2.编写人得票统计程序。设有3个候选人,每次输入一个得票候选人的名字,不考虑弃权情况,要求最后输出各个候选人的得票结果(参加投票人数由程序运行时输入)。
热门文章
- Canal Mysql binlog 同步至 ElasticSearch 详细介绍
- kafka manager 2.0 工具下载 已打包完成
- 大数据时代下,App数据隐私安全你真的了解么?
- 龙蜥利器:系统运维工具 SysAK的云上应用性能诊断 | 龙蜥技术
- 友盟+联合EB级云数据 实现友盟域和企业私域数据全面融合
- 揭秘 Flink 1.9 新架构,Blink Planner 你会用了吗?
- 基于External-DNS的多集群Service DNS实践
- 如何使用阿里云ARMS轻松重现用户浏览器问题
- 与变异风险词赛跑 阿里探索AI治理网络风险
- 云现场 | 为什么说边缘计算是5G时代的必备品?