我们都知道arxiv.org是一个非常大的预印本资源库,里面有大量的优质论文,但缺点是浏览、搜索和排序不是很方便。这个库每天会更新大量的论文,可不幸的是,你只能通过这样超级长的列表去找,还没有标签。

这样特别容易让人和一些优秀的有趣儿的论文擦肩而过,这些论文可能是和你的研究领域相关的。所以接下来你可能就能猜到这个arxiv-sanity是干什么用的了。

首先,arxiv-sanity在展示最新更新的文献时,提供了可读性更强的缩略图预览模式方便读者来快速预览,并在缩略图下方的绿色区域显示文献的abstract 。

更重要的是,它可以让你根据自己的阅读兴趣对文献进行重新排序。比如这里有一篇关于对人体姿态估计的文献是你感兴趣的,点击右上角的' rank by tf-idf similarity to this',文献列表会根据按照与这篇文章的相关度进行排序,我们会看到arxiv上所有关于人体姿态识别的论文。这个功能是基于TF-DF算法来实现的,效果很好。(一种文档特征提取法,它是由Salton在1988 年提出。其中TF 称为词频,  IDF 称为反文档频率, 感兴趣的可以自己百度。)

我们还可以搜索文档。比如我们搜索Geoff Hinton,我们就可以看到他最近在arxiv发表的文献了。

如果你是注册用户,在登录账户之后,还可以把自己感兴趣的文献收藏的你的个人图书馆。比如,我喜欢上图的这篇人体姿态估计的文献,点击右上角存盘图标,(看到了吗?就在' rank by tf-idf similarity to this'下面),点击之后就把这篇文献存在我自己的library里面了。

这时,刚刚黑色的图标变成了蓝色,点击上面的library标签,可以看到它出现在了最上方。你可以像这样收藏很多自己感兴趣的文献。想删除的时候,在自己的library里面再次点击那个图标就可以删除了。

另外,library不光是用来收藏和跟进自己领域的论文更新进度,arxiv-sanity可以通过你收藏的内容给你推荐你也许会感兴趣的论文。具体怎么实现的呢?library内部的论文会被标记为positive,Library之外的论文标记为negative,然后arxiv-sanity基于bigram文本特征提取来训练你的personal SVM,然后在reconmmended 标签里推荐给你。点击recommended标签你就可以看到最近两周arxiv-sanity认为你会感兴趣的文献。当然,你也可以通过设置时间来自己筛选,如去年,上个月,上周,昨天,和全部,看看自己有没有错过什么文献。

最后,在介绍一下“top recent”标签。这里面展示的是arxiv-sanity上被用户收藏最多的文献。这些文献也可以按照时间来筛选。即使你不是注册用户,你也可以浏览到大家都在收藏的文献。

在页面上方可以看到,arxiv-sanity只展示machine learning的论文,如CV,CL等ML的分支领域,因为这是arxiv-sanity作者自己的研究领域。(对,这是人家闲暇时间写的)。作者已经把arxiv-sanity开源了,所以如果你想根据自己的研究领域新建自己的arxiv-sanity,可以去GitHub自己fork。GitHub搜索 karpathy/arxiv-sanity-preserver。

  • cs.CV: Computer Vision and Pattern Recognition 计算机视觉与模式识别;
  • cs.CL:Computation and Language 计算语言学;
  • cs.LG:Learning 机器学习(计算机科学);
  • cs.AI:Artificial Intelligence 人工智能;
  • cs.NE:Neural and Evolutionary Computing 神经与演化计算;
  • stat.ML:Machine Learning 机器学习(统计学)。

介绍arxiv.org的文献更新管理工具arxiv-sanity相关推荐

  1. win更新管理工具有用吗_7个非常有用的在线业务管理工具

    win更新管理工具有用吗 Though there is a lot of work involved in creating and managing an online business, the ...

  2. KubeOperator总体介绍(K8S集群部署管理工具)

    总体介绍⚓︎ KubeOperator 是一个开源的轻量级 Kubernetes 发行版,专注于帮助企业规划.部署和运营生产级别的 Kubernetes 集群. KubeOperator 提供可视化的 ...

  3. 介绍几个常用的代码管理工具

    1.github 官网:https://github.com/ 这个代码管理工具我之前也用过,适合初学者团队开发,团队人数可以无限,是开源免费的.有很多初学者都是在这上面下载别人的源代码来学习.它也可 ...

  4. 介绍几款常用的在线API管理工具

    在项目开发过程中,总会涉及到接口文档的设计编写,之前使用的都是ms office工具,不够漂亮也不直观,变更频繁的话维护成本也更高,及时性也是大问题.基于这个背景,下面介绍几个常用的API管理工具,方 ...

  5. 介绍两款API管理工具

    2019独角兽企业重金招聘Python工程师标准>>> 介绍.收藏两款API管理工具: 1) AMP, https://github.com/gomeplusFED/AMP 2) 小 ...

  6. 开源机器学习模型管理工具DVC介绍

    算法工程师往往在使用算法的过程中要不断地调整参数去找到最好的效果,俗称"调参民工".在不断的调参过程中,会产生各种各样的模型,如何记录好这些参数与模型效果对应的关系,往往另算法工程 ...

  7. golang中的包管理工具——govendor和godep简单学习

    为什么用vendor目录 依赖问题 我们知道,一个工程稍大一点,通常会依赖各种各样的包.而Go使用统一的GOPATH管理依赖包,且每个包仅保留一个版本.而不同的依赖包由各自的版本工具独立管理,所以当所 ...

  8. 超棒的Domino一体化管理工具

    大家好,才是真的好. 虽然绝大多数运维Notes/Domino工作都可由Domino Admin管理客户机来完成,但总有不少人会有一些特定或个性化的管理需求.例如在一个地方管理所有Notes数据库或A ...

  9. 五种常见 Linux 系统安装包管理工具中文使用指南

    公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! 介绍常见 Linux 操作系统的安装包管理工具,主要介绍其使用命令! 包管理系统除了安装软件外,它还提供了工具来更 ...

最新文章

  1. 【题解】 bzoj1260: [CQOI2007]涂色paint (区间dp)
  2. 远程处理Remoting
  3. [我的1024开源程序]200元仿豆瓣小程序带评论
  4. C# API强制关机、重启以及注销计算机
  5. 卷积在计算机中实现+pool作用+数据预处理目的+特征归一化+理解BN+感受野理解与计算+梯度回传+NMS/soft NMS
  6. linux ipset 流量,linux中ipset命令的使用方法详解
  7. jmeter脚本写个小demo(html论坛自动发帖、json龙果学院-前后端分离)
  8. 人工鱼群算法python_人工鱼群算法简介及应用
  9. 架构语言ArchiMate - ArchiMate提供的基本视角(Viewpoints)介绍一
  10. mysql双机热备 读写分离_轻松搭建MySQL主从复制、读写分离双机热备)
  11. 七大行星排列图片_太阳系九大行星排列顺序(口诀:水金地,火木土,天海)...
  12. 分析游戏设计中的色彩心理学
  13. 金字塔原理4个基本原则_青松财经发现,股市中存在4个基本原理,学会了少吃亏!...
  14. 误删c盘user文件夹后,如何恢复文件
  15. 易共享android工具下载,EasyShare app
  16. JQuery 多选下拉列表左右移动
  17. php yield Generator 处理大数组
  18. 数论专题(一)数论基本概念
  19. 数据结构:双向链表p结点前插入q
  20. 计算机系分团委学生会工作总结,计算机系分团委学生会工作总结范文1200字

热门文章

  1. 九宫八卦--易学基础
  2. Anti_TexturePacker工具
  3. 设计模式(三)- 责任链模式
  4. 个人网上银行常见问题
  5. python教程自带数据库_Python入门进阶教程-数据库操作
  6. python空列表列表初始化_Python如何初始化列表?
  7. C语言数据结构与算法---图的遍历
  8. matlab excel操作,Matlab读取excel文件里数据的操作流程
  9. 二进制部署K8S(上)
  10. UTF8、UTF16、UTF32区别