2020 年会议线上召开,会议网站也和以往大不相同

官网本身就提供了文章的主题分类检索与下载

尽管如此,还是希望能够制作一份方便本地查找的目录,毕竟访问外网有点卡

下载 json 文件

通过网站页面源码分析,发现所有数据都在这份 icml_paper.json 文件中,把它下载下来:
https://icml.cc/static/virtual/data/icml_papers.json

你要是直接打开的话,就是这个样子,当然我们接下来就用 python 的 json 包来解析它!

解析 json 文件

import json
filename = 'icml_papers.json'
with open(filename, 'r') as file:content = file.read()js = json.loads(content)
print(len(js))   # 1086 篇文章

获取下载链接

json 文件中没有下载链接,需要跳转到单篇文章页面去下载

import requests
from bs4 import BeautifulSoup
import redef get_download_link(id):url = 'https://icml.cc/virtual/2020/poster/'+str(id)  # 通过 id 跳转到单篇文章页面html = getPage(url)bsObj = BeautifulSoup(html, "lxml")return bsObj.find('a', {'href': re.compile('.*static\/paper_files\/icml\/2020\/.*.pdf')})['href']  # 在单篇文章页面获取下载链接

创建 tsv 文件

for j in js:with open('result.tsv','a', encoding='utf8') as file:item = []item.append(str(j['id']))item.append(j['content']['title'])item.append(', '.join(j['content']['authors']))item.append(', '.join(j['content']['keywords']))item.append(get_download_link(j['id']))s = '\t'.join(item) + '\n'print(s)file.write(s)

用 excel 打开生成的 tsv 文件,如下所示:

这里有 1086 篇文章的下载地址哦:https://download.csdn.net/download/itnerd/12789245

既然能用 excel 打开,那就可以做一些统计啦

33 大研究领域

各类主题占比

最多的是学习理论

ICML2020 文章目录及下载链接相关推荐

  1. 第八批国家药品集中采购-(附药品集采目录明细下载)

    2023年3月2日,'国家组织药品联合采购办公室'发出了<全国药品集中采购文件>,宣告了第八批国家组织药品集中采购工作正式开展,其公告中还包含三个附表分别为'采购品种目录'.'各地区首年约 ...

  2. VMware安装windows server 2012 r2详细教程(附下载链接)

    VMware虚拟机安装Windows server 2012之前,要满足两个条件: 1.自己在本机上已经安装了"VMware Workstation Pro"这个软件(图标类似于这 ...

  3. 必不可少!STL源码目录结构分析,附加源码下载链接

    一.STL源码的下载 下载地址1 3种下载方式: 公众号[多栖技术控小董]回复[12754727]获取百度云下载链接. CSDN:https://download.csdn.net/download/ ...

  4. 第十六届全国大学生智能车竞赛比赛获奖证书格式说明以及下载链接

    简 介: 本文给出了 第十六届全国大学生智能车竞赛 获奖证书的格式说明以及制作方法.证书的格式也参照了 第十五届智能车竞赛电子证书格式说明 .同时,获奖证书下载链接在后面给出. 关键词: 全国大学生智 ...

  5. hfss matlab联合仿真_一文搞定matlab 与 STK 联合调试仿真环境配置(文末附软件下载链接)...

    最近在做导师给的课题:卫星星座的快速优化设计. 需要用到matlab 和 STK 来进行联合调试仿真,但是这第一步的环境配置就让我头疼了几天.在好几次重装,失败和查找资料之后,我终于成功实现了matl ...

  6. 【超详细】模拟器EVE的安装与使用,附下载链接

    文章发不了链接,安装包下载 加微 xmws-IT,备注:思科模拟器 1. 在电脑上安装VMware Workstation软件. 2. 把虚拟机拷到电脑的非系统盘上面. 3. 用VMware Work ...

  7. 【收藏】Linux系统常用命令速查手册(附PDF下载链接)

    给大家收集整理了日常常用的Linux系统命令,仅供大家参考. 大家如果觉得文章看起来不太方便,可以在+qq. 2 3 5 53 3 1 0 4 6 备注"liunx命令",即可获取 ...

  8. 电工杯:电动汽车的充放电优化(有数据代码下载链接)

    个人电气博文目录链接: 学好电气全靠它,个人电气博文目录(持续更新中-) 文章目录 一.电动汽车充放电优化管理 二.数据代码下载链接 一.电动汽车充放电优化管理 二.数据代码下载链接 代码和论文在一起 ...

  9. 电气论文:梯级水电站调度优化建模(文末有程序下载链接)

    系列文章目录 个人电气博文传送门:学好电气全靠它,个人电气博文目录(持续更新中-)     本文针对梯级水电站调度优化进行建模,简单文字描述加程序共22页.matlab 和python双语言编写. 作 ...

最新文章

  1. 大厂都拿捏的缓存方案,平台级分布式缓存,什么业务才合适?
  2. 动态规划问题之一马当先
  3. jzoj100044-abcd【多重背包,二进制压缩,dp】
  4. 腾讯阿里美团相继搞事,渣本程序员的出路在哪?
  5. lda进行图片分类_基于SIFT+Kmeans+LDA的图片分类器的实现
  6. 什么浏览器好用_为什么国外的UC浏览器这么好用
  7. http地址后面加上问号?防止IE缓存
  8. 微信小程序底部导航栏小效果
  9. 论文查重系统哪个好?
  10. sed替换指定字符串为某变量的值
  11. 求x的n次方编程_c语言求x的n次方的函数介绍
  12. 1068 万绿丛中一点红 (20分)测试点分析
  13. java统计每个单词单词出现的次数_Java统计英文句子中出现次数最多的单词并计算出现次数的方法...
  14. 二、文字转成图片,图片上写字
  15. Ai作图工业化流程工具
  16. p值 统计学意义_统计学意义不重要为什么p值不应过高
  17. 棱镜门事件的思考:黑客是什么,如何成为黑客?[更新:2015-05-09]
  18. 奇淫技巧:熟练使用Fetch一个干翻PostMan的顶级技巧
  19. 冬季主题调色效果Lr预设
  20. 4.Rabbits and Recurrence Relations

热门文章

  1. [软件更新]QQ影音1.2 (408)
  2. 华为云会议到底能做什么?一张图让你了解华为云会议!
  3. 被人伤害了,可以主张哪些赔偿
  4. 微服务架构下的 服务熔断, 降级, 限流
  5. AMD的cpu如何安装Mac OS
  6. zedboard 音频芯片 adau1761 linux 下音频驱动(一)简介
  7. 操作系统from清华大学向勇,陈渝 笔记(二)操作系统的启动、中断、异常、系统调用
  8. selenium+testng二之following-sibling使用WebDriverWait
  9. niushop打包云闪付小程序,调起云闪付授权登录
  10. 买到了翻新镜头(佳能(Canon)EF 70-200mm f/2.8L IS II USM 镜头)