原标题:3行Python代码就能获取海量数据?

一谈起数据分析,首先想到的就是数据,没有数据,谈何分析。

毕竟好的菜肴,没有好的原材料,是很难做的~

所以本期小F就给大家分享一个获取数据的方法,只需三行代码就能搞定。

「GoPUP」,大佬造的轮子,大概有100+的免费数据接口。

GitHub:https://github.com/justinzm/gopup

使用文档:http://doc.gopup.cn/#/README

主要有指数数据、宏观经济数据、新经济数据、微博KOL数据、信息数据、生活数据、疫情数据等。

# 安装gopup

pip install gopup --upgrade

安装成功后,就能使用了。

01 微博指数

获取指定关键词的微博指数。

# 微博指数

importgopup asgp

df_index = gp.weibo_index(word= "马保国", time_type= "1month")

print(df_index)

time_type="1month"; 1hour, 1day, 1month, 3month 选其一。

三行Python代码实现数据获取。

02 百度指数

获取指定关键词的百度搜索指数。

# 百度指数

importgopup asgp

cookie = "此处输入您在网页端登录百度指数后的 cookie 数据"

index_df = gp.baidu_search_index(word= "马保国", start_date= '2020-11-15', end_date= '2020-11-25', cookie=cookie)

print(index_df)

需要登陆百度指数,获取你的Cookie。

设置关键词,时间起始,就能获取到马保国老师的热度数据了。

后面还有百度资讯、媒体、需求图谱、人群年龄、性别、兴趣分布数据接口,就不一一介绍了。

感兴趣的同学可以自行去查看文档。

03 头条指数

获取指定关键词的头条指数。

接口挂了,不知为何~

还有相关性、情感、地域、城市、年龄、性别、用户阅读兴趣分析数据等接口。

04 谷歌数据

需要通过代理才能使用,不过上面这三类已经完全够用了。

# 谷歌数据

importgopup asgp

index_df = gp.google_index(keyword= "马保国", start_date= '2020-11-15T10', end_date= '2020-11-25T23')

print(index_df)

05 宏观经济数据

有一个杠杆率的数据可以使用。

# 杠杆数据

importgopup asgp

df_index = gp.marco_cmlrd

print(df_index)

不懂经济学,所以不明觉厉。

06 新经济数据

这个数据倒是蛮有趣的,主要是公司数据。

比如独角兽和倒闭公司的数据。

# 独角兽公司数据

importgopup asgp

df_index = gp.nicorn_company

print(df_index)

一共是240家独角兽公司。

蚂蚁、字节、阿里云、滴滴,都是行业中的大佬。

# 倒闭公司数据

importgopup asgp

df_index = gp.death_company

print(df_index)

倒闭的公司一共有6921家。

看到不少P2P的公司。

剩下还有有一个特许经营许可数据,好像是吊牌销售的意思。

前段时间看到一篇文章,讲的就是南极人吊牌销售的事情,南极人都不自己搞生产,而是代工。

07 KOL数据&信息数据

主要是微博的KOL,所以没啥用。

# KOL数据

importgopup asgp

g = gp.pro_api(token = "……")

df_index = g.weibo_user(keyword= "雷军")

print(df_index)

信息数据是新闻联播文字稿。

08 中国油价数据

包含汽油和柴油的调价信息数据。

# 油价数据

importgopup asgp

df_index = gp.energy_oil_hist

print(df_index)

时间从2000年直到2020年,细数20年油价变化。

09 百度迁徙数据

可以用来做飞线图或者OD图。

单次返回100个城市的数据。

10 影视数据

实时电影票房数据,最近又有病例出现,数据应该也比较惨淡。

这里需要一个WebDES.js文件,才能请求成功。

# 实时电影票房数据

importgopup asgp

df_index = gp.realtime_boxoffice

print(df_index)

「如果声音不记得」当日1千万的票房,太少了。

单日影院数据,今年影院能倒闭一大堆。

# 单日影院数据

importgopup asgp

df_index = gp.day_cinema(date= "2020-12-08")

print(df_index)

得到票房前100的数据。

最高应该是8万多的收入。

实时电视剧播映指数,天气冷了选个好剧或者综艺,窝在被窝刷起来。

# 电视剧数据

importgopup asgp

df_index = gp.realtime_tv

print(df_index)

大秦赋,小F也在看,感觉还不错。

还有实时综艺播映指数、艺人商业价值、流量价值等数据。

11 全国高等学校数据

普通高等学校名单,包含名称、主管部门,所在省市、所在地、办学层次等信息。

# 普通高等学校数据

importgopup asgp

df_index = gp.university

print(df_index)

一共是2631所高校。

还有成人高等学校以及高等学校详情数据。

有网易、丁香园、百度三家的疫情数据。

# 世界历史累计确诊数据

importgopup asgp

covid_163_df = gp.covid_163(indicator= "世界历史累计数据")

print(covid_163_df)

目前累计207个国家有疫情出现。

全世界总共就233个国家和地区,快接近90%了。

由于数据接口太多了,小F就不一一介绍了。

查看文档: http://doc.gopup.cn/#/data/index_data返回搜狐,查看更多

责任编辑:

python输入三行数据_3行Python代码就能获取海量数据?相关推荐

  1. python自动修图软件_3 行 Python 代码实现 5 秒抠图的 AI 神器,告别PS(附教程)...

    文 | 苏克 1900@高级农名工 推荐 | 编程派公众号(ID:codingpy) 曾几何时,「抠图」是一个难度系数想当高的活儿,但今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度 ...

  2. python开发ps插件_3 行 Python 代码实现 5 秒抠图的 AI 神器,告别PS(附教程)

    文 | 苏克 1900@高级农名工 推荐 | 编程派公众号(ID:codingpy) 曾几何时,「抠图」是一个难度系数想当高的活儿,但今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度 ...

  3. python怎么换背景_3行Python代码实现图像照片抠图和换底色的方法

    1.项目背景 对于不会PS的小伙伴,抠图是一个难度系数想当高的活儿,某宝照片抠图和证件照换底色均价都是5元RMB,所以今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度抠图,甚至都不用 ...

  4. python数组合并、输入三行数据,如何在python中合并两个或三个3D数组?

    Numpy的hstack.vstack或dstack(取决于要连接数组的轴)将连接多维数组.在 请注意,对于MODIS气溶胶数据,使用hstack连接阵列有时会抛出错误,因为有时阵列是203 x 13 ...

  5. python输入逗号分隔_命令行Python逗号分隔的用户输入int值

    "2,3"是一个字符串,将其传递给函数不会使其表现为由,分隔的两个不同参数(如您所料).在>>> def func(arg): ... print arg ... ...

  6. python读取文件第n行-Python读取文件后n行的代码示例

    这篇文章主要介绍了Python实现读取文件最后n行的方法,涉及Python针对文件的读取.遍历与运算相关操作技巧,需要的朋友可以参考下# -*- coding:utf8-*- import os im ...

  7. python自动化--如何用10行Python代码调一个闹钟 #电脑调闹钟

    python自动化--如何用10行Python代码写一个闹钟 前言: 文末彩蛋--轻松一刻 更多关于Python的知识请加关注哟~~.若需联系博主请私信或者加博主联系方式:       QQ:1542 ...

  8. 代码 抠图_3 行 Python 代码 5 秒抠图的 AI 神器,根本无需 PS,附教程

    曾几何时,「抠图」是一个难度系数想当高的活儿,但今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度抠图,甚至都不用会代码,点两下鼠标就完成了. 感受下这款抠图工具抠地有多精细: 是不是 ...

  9. 代码 抠图_3 行 Python 代码 5 秒抠图的 AI 神器,根本无需 PS

    文 | 苏克 1900@高级农名工 推荐 | 编程派公众号(ID:codingpy) 曾几何时,「抠图」是一个难度系数想当高的活儿,但今天要介绍的这款神工具,只要 3 行代码 5 秒钟就可以完成高精度 ...

最新文章

  1. java map深拷贝_java 实现Map的深复制
  2. 关于C#中编译器保证变量必须初始化规则猜想
  3. C/C++从源代码到生成可执行程序的过程详解!
  4. 二进制包方式安装部署三节点k8s
  5. 一块移动硬盘怎样兼容Mac和Windows系统,并且可以在time machine上使用
  6. PO、VO、POJO、DTO、DAO、Service包等常见包的理解
  7. ES07--性能调优03(全面考量)
  8. 运用ECharts展示股票k线图
  9. 项目管理知识体系指南 PMBOK(第6版)十大知识领域思维导图(总览图)
  10. Speedoffice(excel)如何自动换行
  11. RHEL5 Oracle 11G R2 RAC 静默安装 (三) rdbms安装 dbca 建库
  12. 如何使html中的图片居中
  13. 关于ant design pro中2个下拉列表,下列列表a的数据需要依据列表b选择的值来进行变化,无法及时获取
  14. html设置自动切图指定位置,HTML5自助切图
  15. Servlet 03
  16. RabbitMQ从入门到实践
  17. vue 路由history模式打包部署 The requested URL * was not found on this server. 的解决方法
  18. python之xlrd
  19. 【色彩管理】YIQ色彩模式详解
  20. C语言编程练习 2.编写人得票统计程序。设有3个候选人,每次输入一个得票候选人的名字,不考虑弃权情况,要求最后输出各个候选人的得票结果(参加投票人数由程序运行时输入)。

热门文章

  1. Canal Mysql binlog 同步至 ElasticSearch 详细介绍
  2. kafka manager 2.0 工具下载 已打包完成
  3. 大数据时代下,App数据隐私安全你真的了解么?
  4. 龙蜥利器:系统运维工具 SysAK的云上应用性能诊断 | 龙蜥技术
  5. 友盟+联合EB级云数据 实现友盟域和企业私域数据全面融合
  6. 揭秘 Flink 1.9 新架构,Blink Planner 你会用了吗?
  7. 基于External-DNS的多集群Service DNS实践
  8. 如何使用阿里云ARMS轻松重现用户浏览器问题
  9. 与变异风险词赛跑 阿里探索AI治理网络风险
  10. 云现场 | 为什么说边缘计算是5G时代的必备品?