卷友们好,我是rumor。

最近李沐沐神横空出世,开始在知乎和B站上传各种课程和论文解读视频,一下就拉高了技术自媒体的门槛,让我开始思考要不要转向舞蹈区或者鬼畜区。大佬果然做什么事情都能做好,从年初3月份到现在,B站已经突破了十万粉,投稿104个,这是深度垂直内容很难达到的高度(不过相信照现在ML的卷度有望成为百大)。

沐神甚至开始专门为大家开启了斯坦福课程中文版,而且是日更,每天B站闲逛的我刷到时都倍感焦虑(因为我没在学习),底下评论区都劝沐神要多注意休息。还有的同学说整个实验室包括导师都在追沐神的课,B站智能姬也专门为评论区的同学灰度了字幕功能,这个学习气氛真的太浓郁了,甚至有同学说沐神直接在B站带研究生

总之引用评论区同学的一句话就是,Mu Li Is All You Need。还在入门的同学跟着走就行了(我的文章也可以偶尔看看,疯狂求生)。

今天就顺着沐神的视频「如何读论文」,也分享一些我的个人私货

地址:https://www.bilibili.com/video/BV1H44y1t75x

看了沐神的视频后,真是相见恨晚。其实我自己读论文的方法也差不多,但却是我迭代了一两年才迭代出来的,如果最开始就知道这个方法会省去很多时间

在我最开始读论文的时候,必须要把所有文章都打印出来,从头读到尾,用笔去各种划线做笔记。只有脱离屏幕,我才能静下心来把那些东西装进脑子里。直到后来我打印的论文越来越多,才不得已在电脑上看。再后来因为写知乎博客,在那段BERT变体疯狂出世的时期,我读论文的速度越来越快,总想第一个把新研究分享出来,当知乎NLP前沿最快的女人。到了现在,我似乎又比之前提高了一些,大家有时会惊讶于我出文的速度,如果文章不太复杂的话,我其实读了标题、摘要、图表之后就开始打草稿了。。。

1.沐神视频总结

论文通常分为6个部分:Title、Abstract、Introduction (包含Related works)、Method、Experiments、Conclusion。

沐神建议大家分三遍来读一篇论文。

第一遍,目的是大概知道论文在讲什么,适不适合自己。先读一下标题和摘要,了解论文在做什么,再直接看结论,虽然大部分都是重复的,但也会把摘要里提到的问题用实际结论再证明一下。再去瞄一眼关键的图和表。这一遍大概要十几分钟,如果确定适合自己,就可以开始第二遍。

第二遍,通读一遍文章,目的是了解文章解决了什么问题,用了什么方法,搞清楚重要的图和表都在干什么,相比别人的方法有什么优点。读的时候可以把有用的东西圈出来,比如重要的参考文献、不懂的句子。这一遍不用特别细节,一些公式和证明可以略过。这遍读完后,如果觉得这份工作对自己有价值,可以继续第三遍的精读。

第三遍,知道每一段每一句都在干什么,把自己放到作者的位置,开始思考自己如何去解决这个问题,如何设计实验,能不能做得更好,或者哪些地方可以继续深入。这样以后基于这份工作扩展,或者使用这个方法的时候就会更自如。

以上就是沐神分享的方法,我的整体差不多,只是不同场景会有diff。一类场景是某类论文的集中调研,可能是项目要落地,也可能是要做research,总之会有个大概的领域和任务限定;另一类场景是随便读读,毕竟周围的人都读,不进则退,被迫好学。下面就分这两个场景介绍一下我的方法。

2.有方向的调研

首先是怎么找论文,这是我后台经常收到的问题。在做research之前一定要调研充分,否则论文都写了一半发现跟之前的撞了,或者审稿人直接给你丢过来一篇就很尴尬。找论文可以从以下四方面:

  1. 先去搜索最近的该领域综述,综述读下来就对该领域有初步理解,知道了历史SOTA

  2. 最近一两年的顶会(NLP比如ACL、NAACL、EMNLP、AAAI、ICLR等),去他们公开的paper list按关键词搜索。怎么找关键词?从之前看的综述里面找

  3. 在Google Scholar等搜索引擎搜关键词,顶会毕竟有几个月的延迟,可能人家先挂出来了

  4. 用上面的方法读了几篇之后,去看他们Related Works、实验对比里的其他方法,基本都是该领域有代表性的

之后是怎么筛选论文,优先看知名会议、机构、作者的文章,一般来说质量还是有保障的。其他的就用沐神的方法先快速扫一下,没价值就不看了。

最后就是读论文了,沐神讲的方法很好,我略微补充几点:

  1. 既然是有方向的调研,就要调研出体系,这个领域有几种问题,每种问题都有什么解决办法,对比起来有什么优缺点

  2. 如果是自己要follow的方法,实验分析环节要仔细的看,怎么处理的数据,用了什么超参数等

  3. 如果要发自己的文章,就要更精细地看一下其他paper都是怎么讲的motivation和contribution

最最后,怎么样想新的idea?就像沐神说的那样,用作者思维去思考,读个一二十篇就能有些感觉。想第一次就发一篇惊世巨作太难了,更多的人还是先follow前人的工作,从其他领域借鉴一些改动,并学习英文的写作方式。所以不要自己干想

3.随便看看

我现在日常就是随便看看,碰到我感兴趣的工作就分享给大家。

首先还是怎么找论文

  1. Arxiv网站每天都会更新大家上传的论文,推荐我之前参与的项目:https://arxiv.xixiaoyao.cn/,我们把论文的作者机构和发表的会议单独筛了出来,方便快速筛选

  2. 顶会paper list也可以刷刷

之后读论文的方法就差不多了。熟能生巧,当对特定领域的论文+偶尔思考超过一定数量之后(感觉自己也就读了不到100篇吧),速度一下就能上去。我速读时的attention主要在

  1. Abstract的重点(也就两三句话)

  2. Introduction中作者提出motivation和contribution那里

  3. Related works里列的方法

  4. Method里面的图表和说明(不太复杂的方法就那么几句话,数据集也都是常见那些)

  5. Experiments里面的主实验、消融实验和其他有趣的分析

这么算下来,一篇方法不复杂的论文半夜纸就能讲清楚,所有故事都能概括成起因经过结果

当然如果要写出来分享给大家,我会把自己放在作者思维再琢磨一下,想想模型处理的细节、哪里不严谨,再去文中找对应的解释。

以上,就是学姐我这么多年积攒的经验了,白嫖的你,开不开心。

整理不易,三连

如何把近十页的论文读成半页?相关推荐

  1. 【学术相关】李沐:如何把近十页的论文读成半页

    最近李沐沐神横空出世,开始在知乎和B站上传各种课程和论文解读视频,一下就拉高了技术自媒体的门槛,让我开始思考要不要转向舞蹈区或者鬼畜区.大佬果然做什么事情都能做好,从年初3月份到现在,B站已经突破了十 ...

  2. 【学术相关】如何将半页纸论文写到十页?

    作者:叶新武,上海财经大学,审稿:牧小熊 昨天发了一篇<如何把近十页的论文读成半页?>,今天在群里看到有些小伙伴在论文上苦苦挣扎,脑海中一下子浮现出各种论文扩充的"奇技淫巧&qu ...

  3. Word如何让不同页显示不同的页码,页眉

    一,让不同页显示不同的页码,页眉,关键是使用分节符对页面进行分节,这样不同的节,就可以设置不同的页码,页眉. (1)"下一页"."连续"."奇数页&q ...

  4. linux more命令 翻页,Linux系统中的翻页命令more和less使用教程

    more more- 在显示器上阅读文件的过滤器[[ ]] 总览 (SYNOPSIS) more[-dlfpcsu] [-num] [+/ pattern] [+ linenum] [file ... ...

  5. 如何将半页纸论文写到十页?

    Datawhale干货 作者:叶新武,上海财经大学,审稿:牧小熊 大家好呀~今天在Datawhale的群里看到有些小伙伴在论文上苦苦挣扎,脑海中一下子浮现出各种论文扩充的"奇技淫巧" ...

  6. 覆盖近2亿篇论文还免费!沈向洋旗下团队「读论文神器」登B站热搜

      视学算法报道   编辑:小咸鱼 好困 [新智元导读]无意中发现B站上有个叫ReadPaper的在线论文阅读笔记神器冲上了热榜!ReadPaper由沈向洋博士创办的IDEA旗下团队研发,其收录了近2 ...

  7. Nature年度十大杰出论文公布:机器狗算法、近室温超导等入选,复旦中科院上榜...

    栗子 鱼羊 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 2019年即将过去,回顾这一年,由哪些科学研究进展令大众印象深刻,或者是令学界为之振奋? 最近,Nature杂志公布了去年发表 ...

  8. 清华姚班陈丹琦获斯隆奖!与去年得主马腾宇是同班同学,博士毕业论文是近十年最热之一...

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 杨净 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 清华姚班大神陈丹琦,刚刚有 ...

  9. 这篇长达165页的论文,用一个里程碑式的证明同时解决了量子物理学和理论数学的难题...

    来源:机器之心 计算机科学.数学.物理学,这三个学科各自的一些重大难题在近日发布的一篇标题简洁的论文<MIP*=RE>中同时得到了解答.在该论文中,五位计算机科学家为可通过计算方式验证的知 ...

最新文章

  1. python常用函数表-python-列表常用函数
  2. java跳转_java 跳转语句
  3. cn_win_srv_2003_r2_standard_x64_with_sp2_cd1_X13-28810 的序号
  4. 深入Spring Boot:快速集成Dubbo + Hystrix
  5. 水晶报表基础入门——4.水晶报表排序、分组技术
  6. scala代码示例_Scala集合示例
  7. js 键盘事件 理解
  8. 从Oracle Database 角度来看浪潮天梭K1主机的操作系统选择
  9. 3U VPX导冷高性能SRIO/以太网数据交换板
  10. access导入失败:操作必须使用一个可更新的查询。
  11. c语言英文信件怎么能,转 英文信件格式(附模板)
  12. 整理41个Python不同方面的练习题,希望对你有帮助
  13. 电商erp软件有哪些好处?
  14. RationalDMIS 2020定制报告(EXCEL)
  15. a标签中的href=javascript
  16. Generalized Robust Regression for Jointly Sparse Subspace Learning
  17. 华硕装鸿蒙系统,智能家居 篇八:解决华硕路由器设置不当造成传感器延迟
  18. 将小写字母转换成大写字母C/C++(指针)
  19. linux离线安装jemalloc,jemalloc在linux上从安装到使用
  20. 【源码】程序员优质资源汇总

热门文章

  1. idea 启动时报 error:java 无效的源发行版
  2. JS通过正则限制 input 输入框只能输入整数、小数(金额或者现金)
  3. 整理Simple.Data使用方法
  4. Swift中使用typealias定义一个闭包closure
  5. 感觉 Data Access Application Block(DAAB) 里也有可能写得不太好的地方
  6. Numpy入门教程:01. 数组的创建与属性
  7. 火爆 GitHub!这个 AI 神器究竟有什么魅力?
  8. GitHub接连封杀开源项目惹众怒,CEO亲自道歉
  9. 口罩检测识别率惊人,这个Python项目开源了
  10. 自动机器学习:团队如何在自动学习项目中一起工作?(附链接)