最近逛 G 站发现了一个优雅的 PHP 爬虫采集工具 QueryList,出于练习,顺手写了一个 Github trending 爬取 API,使用最新的 Lumen 8 实现,已部署到了Heroku,可以很方便地调用并集成到你的项目中。

项目地址:Github Trending

预览地址:中文区 PHP 项目最新趋势

接口清单

Trending Api

接口地址:https://crawl-github-trending.herokuapp.com/github/trending/{language}

请求参数:

  • language:支持的编程语言;可以先调用下面的 Language 接口来查看支持哪些编程语言编码。
  • spoken_language:支持的语种编码,比如,zh 表示中文;可以先调用下面的 Spoken language 接口来查看支持哪些语种编码。
  • since:时间周期,支持 daily,weekly,monthly

接口响应:

{"status": "success","code": 200,"message": "Success.","data": [{"repo": "/Jiannei/lumen-api-starter","description": "","language": "php","stars": "66,666","forks": "666","added_stars": "66 stars today","spoken_language": "zh"}],"error": []
}

举例:

  • 查询当天中文区的 php 项目趋势:https://crawl-github-trending.herokuapp.com/github/trending/php?spoken_language=zh
  • 查询本周中文区的 php 项目趋势:https://crawl-github-trending.herokuapp.com/github/trending/php?spoken_language=zh&since=weekly

Spoken language

接口地址:https://crawl-github-trending.herokuapp.com/github/spoken-languages

接口响应:

{"status": "success","code": 200,"message": "Success.","data": [{"code": "zh","name": "Chinese"},{"code": "en","name": "English"}],"error": []
}

Language

接口地址:https://crawl-github-trending.herokuapp.com/github/languages

接口响应:

{"status": "success","code": 200,"message": "Success.","data": [{"code": "c++","name": "C++"},{"code": "html","name": "HTML"},{"code": "java","name": "Java"},{"code": "javascript","name": "JavaScript"},{"code": "php","name": "PHP"}],"error": []
}

其他

Packages

  • lumen-api-starter :基于最新版 Lumen,遵循 Repository & Service 架构的实践项目。
  • jae-jae/querylist :优雅的渐进式PHP采集框架,让采集更简单一点。
  • spatie/valuestore :维护配置到 json文件。

维护

爬取规则维护在 resources/crawl/github.json 文件中,如果接口失效,欢迎提交 pull request,或者联系我 longjian.huang@foxmail.com 进行更新,方便后续其他同学调用。

简单撸了个 GitHub trending 爬取 API相关推荐

  1. 最简单的爬虫,用pandas爬取表格数据

    最简单的爬虫:用Pandas爬取表格数据 大家好,我是小五

  2. python热搜排行功能_简单几行代码用Python爬取微博的热搜榜

    简单几行代码用Python爬取微博的热搜榜 想要实时的看微博热搜 但是又不想去微博网站看!怎么办呢?其实很简单! 我们学了这个requests_html 这个库之后 就更加的简单了! 小编只用了短短的 ...

  3. python爬微博关键字_一个简单的python爬虫实践,爬取包含关键词的新浪微博

    此项目主要功能是通过微博"搜索"页面,每天自动爬取所有包含自定list中词汇的微博原数据.低速可控,简单粗暴,适合用来有针对性的搜集数据量不是很大的包含关键词的微博,每日可爬3-6 ...

  4. 简单记录一下使用python pyppeteer爬取努努书坊的爬虫

    RT,是用python+pyppeteer随便写的,比较简单,权当做记录备忘而已. 不作任何这方面的疑问解答. import pyppeteer,asyncio,sys,io,os,re,time,d ...

  5. java爬虫自动识别验证码_简单Java爬虫(一)爬取手机号码

    原创 野狗菌 希望你能喜欢 今天 关于本文: 本文介绍一个简单Java爬虫,获取网页源码,爬取电话号码. 本篇教程用我的博客一个测试网页演示. --野狗菌[希望你能喜欢] 测试页面: https:// ...

  6. 简单一点,利用xpath解析爬取站长素材的图片

    先看爬取成果: 把美女图片下载到一个专门的文件夹下,时不时浏览一下时不时很称心如意呢?(无图展示) 具体流程: 首先来到站长之家:url="站长素材-分享综合设计素材的平台" 这里 ...

  7. Python爬虫实例(5)-简单的爬虫,用XML爬取卡车图片

    一个简单的爬虫,所用的技巧都是上几篇博文中讲到的. 用于帮助杨烈的课题,搜集几百张卡车的图片.本来想在百度图片,直接输入"卡车"搜索,但是百度图片的网页加载方式没看明白.只是在&q ...

  8. python简单小脚本:模拟键盘爬取VirusTotal样本信息

    背景: 当时通宵写incaseformat病毒报告时,有个数据展示需求:根据我们收集整理后的6000个相关样本sha256去VT爬取对应的First Submission.由于之前用过VT提供的API ...

  9. 简单几行代码带你爬取王者荣耀皮肤

    爬取王者荣耀皮肤 分析思路 源代码 爬取王者荣耀皮肤 分析思路 url:https://pvp.qq.com/web201605/js/herolist.json url还是很容易拼接的 源代码 im ...

最新文章

  1. 不同Activity之间传递数据--Bundle对象和startActivityForResult方法的实现
  2. java出现404的原因是_为什么使用eclipse总是出现404
  3. linux下创建mysql用户,并且给增删改查的权限
  4. 打印100~200 之间的素数
  5. jsoup的介绍使用(转)
  6. SAP CDS view自学教程之八:SAP Fiori Elements里不同类型的annotation
  7. java axmlprinter_安卓xml配置文件解析工具-AXMLPrinter2.jar(androidmanifest.xml 反编译)下载官方最新版-西西软件下载...
  8. Java StringBuilder codePointAt()方法与示例
  9. 日志框架介绍(SLF4J及其使用)
  10. http返回头中content-length与Transfer-Encoding: chunked的问题释疑
  11. 【翻译】Sencha Cmd中脚本压缩方法之比较
  12. Gauss Elimination算法分析与实现
  13. 我的编程学习日志(9)--交换A,B值得方法(相加,异或,swap函数)
  14. asp.net使用Mysql乱码处理
  15. jsp复习题库(1)
  16. 该战斗的时候战斗,该转身的时候转身,但请保持优雅
  17. Nehe教程16课雾
  18. Android以太坊钱包全部功能-基于web3j实现
  19. Python科学计算的瑞士军刀——Anaconda 安装与配置
  20. 定义一个圆形Circle类。属性: r:半径 成员方法:get/set方法 showArea方法:打印圆形面积 showPerimeter方法......

热门文章

  1. 解决夜神模拟器与Eclipse断开连接,逍遥模拟器与Eclipse断开连接问题
  2. c语言汉诺塔动画程序,C语言实现的动画汉诺塔
  3. centos7重置密码,读写u盘
  4. 图像压缩小波变换原理
  5. C语言二级不过算挂科吗,为什么总是你挂科,也许是你一直在被动复习二级C语言试题...
  6. image在div中有留白如何解决
  7. 关于release版本和Debug 版本的问题 终结
  8. 索爱java好的机型,新款索爱手机型号(索爱半智能手机形象的索爱A200操作系统)...
  9. vcenter 7.0 安装VMware-vRealize-Log-Insight-8.1.1.0
  10. 推荐一个免费看标准的好网站