查找论文及对应源码的神器 Papers With Code 刚刚推出了最新版本,可以用图形界面查找你想要的 SOTA 实现,从应用领域到具体任务再到实现代码一步到位。据网站开发者介绍,里面包含了 966 个机器学习任务、515 个评估排行榜(以及当前最优结果)、8625 篇论文(带源码)、704 个数据集。

站地址:https://paperswithcode.com/sota

Papers With Code 简介

Papers With Code 由 Reddit 用户 rstoj 开发,旨在提供免费、开源的机器学习论文资源、代码和评估排行榜。目前该网站已经完成了代码与论文的自动化链接,正在研究自动提取论文中的评估数据。

该网站将 ArXiv 上的最新机器学习论文与 GitHub 上的代码(TensorFlow/PyTorch/MXNet 等)对应起来。用户可以按标题关键词查询,或者按流行程度、GitHub 收藏数排列「热门研究」。

据了解,Papers With Code 网站上的所有内容都是可编辑的,而且是版本化的。用户可以从中发现好的任务和最优结果,甚至发现一些以前不知道的研究精华。开发者还开源了整个数据集。

数据下载

  • 论文摘要:https://paperswithcode.com/media/about/papers-with-abstracts.json.gz
  • 论文与代码之间的链接:https://paperswithcode.com/media/about/links-between-papers-and-code.json.gz
  • 评估排行榜:https://paperswithcode.com/media/about/evaluation-tables.json.gz

数据源

大部分数据来自于开发者的论文标注。为了确保广泛覆盖机器学习任务,开发者解析了 6 万多篇论文的标题(命名为「Method X for Task Y」)。此外,开发者还在 2018 年最后一个季度的 1600 篇 arXiv 论文摘要中手动标注了任务和数据集。

开发者还 follow 了以下项目的数据:

  • NLP 进展:https://github.com/sebastianruder/NLP-progress
  • EFF AI metrics:https://github.com/AI-metrics/AI-metrics
  • SQuAD:https://rajpurkar.github.io/SQuAD-explorer/
  • RedditSota:https://github.com/RedditSota/state-of-the-art-result-for-machine-learning-problems

抓取和导入数据的代码也已开源,详见:paperswithcode/sota-extractor 。

覆盖类别

Papers With Code 网站涉及广泛的机器学习任务,目前包含 966 个机器学习任务、515 个评估排行榜(以及当前最优结果)、8625 篇论文(带源码)、704 个数据集,其中光是计算机视觉就覆盖了多达 552 种任务。这些机器学习任务具体分类是:计算机视觉、自然语言处理、医疗、方法(Methodology)、语音、游戏、图、时序、音频、机器人、音乐、推理、计算机代码、知识库、对抗等。

图源:https://paperswithcode.com/sota

除此之外,我们还可以在该网站上查看「Trending Research」、「Latest Research」和「Top Papers」。每一个分类下面所列出的项目包含:论文标题、机构、发表日期、摘要、任务分类等信息。

使用

现在,我们来看看这个 ML SOTA 浏览器怎么用吧。

如果你进入了主页而不是上图页面,那么只要在原来的主页点击搜索框旁边的 Browse state-of-the-art,就可以看到上图的界面了。

以计算机视觉中的语义分割(Semantic Segmentation)任务为例。从 Browse state-of-the-art 主页视图中可以直接看到,语义分割任务中包含了 9 个排行榜以及 299 篇论文。

点进去之后就能看到这 9 个排行榜。不过 9 这个数字好像对不上,算了这不重要。我们可以看到 5 个数据集的 SOTA 论文,每一行分别列出了数据集名称、SOTA 模型名称、论文、源代码等。例如,第一行展示了在 PASCAL VOC 2012 数据集上的当前最佳模型是 DeepLabv3+ (Xception-JFT),源论文是《Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation》。点击「See all」,就能查看排行榜的更多细节,我们点击第一行的「See all」。

如下图所示,点击「See all」之后,页面跳转到在 PASCAL VOC 2012 数据集上的排行榜详细信息,如下图所示,图中绿色点为曾经的 SOTA 论文,图中折线表示趋势图,灰色点表示性能较弱的其他论文。上图中「趋势」栏中的小图即各排行榜的 SOTA 趋势图。鼠标落在图中的点就能显示相应的模型和性能信息,点击即可直达论文详情页面(Papers With Code 页面)。

在趋势图下方则列出了完整的数据表格,按照评估指标从大到小排序。DeepLabv3+ (Xception-JFT) 在语义分割任务中排名第一,Mean IoU 分数为 89.0%。

接下来,我们点击 DeepLabv3+ (Xception-JFT) 行中的超链,就能到达该模型的 Papers With Code 页面,上面显示了论文标题、摘要、arXiv 链接,以及最重要也是 Papers with Code 最让人心水的地方——直接提供实现代码的 GitHub 链接,还不止一个。在 DeepLabv3+ (Xception-JFT) 的页面中就提供了多达 15 个实现,这些实现按照 GitHub 收藏量排序,并显示基于什么框架实现。

终于找到想要的实现了吗?请慢用......

代码实现列表下方还展示了这个模型在其他任务上的排行榜排名和性能。从下表可以看到,

DeepLabv3+ (Xception-JFT) 还在 Cityscapes 上实现了 82.1% 的当前最佳 Mean IoU。

到此,Papers With Code 的功能就介绍得差不多了。我们再看看其中一些让人惊喜的地方。在所有数据集的排行榜页面下方还可以看到,有非常良心的子任务分类。也就是说在语义分割页面,你还能看到和语义分割相关的其它子任务的排行榜,有实时语义分割、场景分割、弱监督分割等。点进去能查看的信息类型和上述例子一致,此处不再赘述。

假期将至,小编要去啃论文了~同学们,跟上!

一行一个链接代码_AI最优论文+代码查找神器:966个ML任务、8500+论文任你选相关推荐

  1. 一行一个链接代码_小白写代码讨女朋友欢心,包教包会

    爱情这点小事里,不花钱也可以很有情致- 你看鹅厂程序员小彭,在520来临之际,给女朋友写了段代码,不花钱就让女朋友惊喜又感动. https://elvinn-1aa07a-1251269979.tcl ...

  2. pandas读取nlp_chinese_corpus里面的json类型的数据,一行一个字典的数据

    最近在用pandas来读取json类型的数据,发现网上资料居然没查到,我这里弥补一下空缺,读取的json数据示例为: {"qid": "qid_1815059893214 ...

  3. 腾讯优图——分布式知识蒸馏损失改善人脸识别困难样本(附论文代码)

    计算机视觉研究院专栏 作者:Edison_G ECCV 2020即将要开始,很多互联网络公司都有技术论文中标,腾讯优图就8篇入选,涵盖了目标跟踪.行人重识别.人脸识别等领域. 今天我们详细分析优图的& ...

  4. html点击按钮弹出悬浮窗_9种实现点击一个链接弹出一个小窗口的代码

    9 种实现点击一个链接弹出一个小窗口的代码 因为着是一段 javascripts 代码, 所以它们应该放在之间. 是对一些版本低的浏览器起作用,在这些老浏览器中不会将 标签中的代码作为文本显示出来.要 ...

  5. 进阶必备:CNN经典论文代码复现 | 附下载链接

    经常会看到类似的广告<面试算法岗,你被要求复现论文了吗?>不好意思,我真的被问过这个问题.当然也不是所有面试官都会问,究其原因,其实也很好理解.企业肯定是希望自己的产品是有竞争力,有卖点的 ...

  6. 撒花!算法岗必须复现的上百篇经典论文代码完结啦! | 附下载链接

    经常会看到类似的广告<面试算法岗,你被要求复现论文了吗?>不好意思,我真的被问过这个问题.当然也不是所有面试官都会问,究其原因,其实也很好理解.企业肯定是希望自己的产品是有竞争力,有卖点的 ...

  7. 图神经网络推荐方向--论文代码读记

    前言 这篇作为自己读论文代码过程中一些简单的代码备忘读记吧,方便查阅. 一.torch.cat() .torch.stack() 拼接张量:torch.cat() .torch.stack() tor ...

  8. 论文代码不开源,应该被直接拒稿?

    公众号关注 "GitHubDaily" 设为 "星标",每天带你逛 GitHub! 转自机器之心 前不久,图灵奖得主 Yann LeCun 公开质疑谷歌大脑的论 ...

  9. 一个请求从 URL 字符串到 HTML 代码的“漫长曲折”之路

    作者:Dino Esposito       出处:msdn ASP.NET HTTP 运行时 一个请求从 URL 字符串到 HTML 代码的"漫长曲折"之路 Dino Espos ...

最新文章

  1. Linxu终端gcc与gcc -c的区别
  2. 字符串(strcmp)
  3. vue2.0 -- watch监听
  4. maven pom resources标签的使用示例
  5. textarea换行符转换
  6. elasticsearch配置文件解析
  7. linux 邮件日志,linux下如何建立邮件日志
  8. docker gpu报错Error response from daemon: could not select device driver ““ with capabilities: [[gpu]]
  9. [eclipse]Syntax error on token ;,{ expected after this token
  10. C++:数字逆向输出
  11. Spark源码分析之Job触发原理
  12. linux用于开发qt java_Linux下Qt程序的打包发布
  13. calendar控件使用 extjs_extjs年月选择日历及通用js同步ajax调用返回json object
  14. 使用PHP和GZip压缩网站JS/CSS文件加速网站访问速度
  15. Java Set操作
  16. 二类高层建筑中的电子计算机,高层建筑结构计算机计算原理及结果简析
  17. java 中的builder_Java设计中的Builder模式的介绍
  18. 尝试一下暴力破解Wifi
  19. 利用Mcafee管理工具绕过McAfee杀毒软件
  20. xp系统显示错误1053服务器,使用故障恢复控制台解决XP系统无法启动的常见故障...

热门文章

  1. jsp删除时提示_Java修行第058-059天 Servlet+JSP+JavaBean整合项目总结
  2. html js url 跳转页面内容,js跳转页面方法总结
  3. vue 日期格式化返回指定个数月份_python时间与日期处理一次看个够(time、datetime、calendar)...
  4. 开氏温度与摄氏度换算_【油品小知识】你不知道的“柴油密度”与“温度”的故事...
  5. python delete_rows,Python:如何刪除以特定字符結尾的行?
  6. 基于JAVA+SpringMVC+MYSQL的健康档案管理系统
  7. 基于JAVA+SpringBoot+Mybatis+MYSQL的图书借阅管理系统
  8. oracle12c官方文档中文版_三分钟让你真正读懂oracle12c 中cdb pdb概念及原理
  9. java网页截图_Java实现的简单网页截屏功能示例
  10. 小米笔试题:无序数组中最小的k个数