视学算法报道  

编辑:LRS

【新智元导读】读论文对于AI新手和工程师来说可能是一件比较难的事。最近一位从业超5年的CV老司机发布了一篇万字长文,讲述了读论文七步法,从找论文到总结,每篇论文由浅入深都需要读4遍。

人工智能从业者需要读论文吗?

机器学习的各种模型发展日新月异,想要走在技术的最前沿,不看论文,光看博客、技术文档是远远不够的。

但随着AI研究从业者逐渐增多,各类科普、教程做的实在是太好了,一些本科生甚至初、高中生都能利用工具来训练自己的模型到现实中的应用。

但对于那些缺乏学术背景、没有系统学习过如何写论文的人来说,读一篇学术论文可能比训练一个模型要难太多了。

并且如果在训练模型过程中有了一些创新的想法,想要发表一篇论文,但读论文都读不好的话,那写论文肯定也会出问题。

最近Nvidia developer上就有一篇博客用万字长文,七步教会你如何「务实地」读论文。

博客作者Richmond Alake是一名机器学习和计算机视觉工程师,主要工作就是帮助各种初创公司开发深度学习模型来解决商业应用中的计算机视觉任务,技术领域的从业时间超过5年。

除此之外,他还是一个博客专家,写过100多篇关于人工智能和机器学习主题的文章,总浏览量超过一百万。

天才第一步:选个好题目

机器学习和数据科学领域有大量可供研究的主题领域,但这并不一定意味着每个研究课题都是好的选择。

对于初入AI行业的人来说,可能更关注于机器学习的各种应用场景,但如果考虑到长期的职业前景的话,那些专业术语又让AI新手感到迷茫。

所以确定一个研究主题是很困难的,对每个人来说,好题目的定义都是不一样的,不过有一点是相同的,要选择一个感兴趣的或者已经有经验的机器学习领域。

对于博客作者来说,深度学习就是他的兴趣。

Richmond表示他当时「误入」计算机视觉的原因就是因为对姿态估计、动作分类、手势识别这些课题特别感兴趣,开发深度学习模型解决CV问题也会让他觉得很有成就感。

不同领域的工程师也需要不同的专业技能。

如果你的目标是自然语言处理工程师,那你就需要研究Transformer,RNN,语言模型,情感分类等等。

对于数据科学家来说,需要更关注数据增强,数据可视化,模式识别的技术。

在这篇博客中,作者选择他比较熟悉的姿态估计(Pose Estimation)为例来介绍。

第二步:找论文

读论文,最重要的就是找到主题相关的、优质的论文。

PapersWithCode是一个比较常用的工具,能够帮助研究人员快速找到机器学习相关的论文,并且还会把论文相关的数据集、代码和其他资源都一起呈现出来。

在网站中搜索Pose Estimation后,就会把相关的数据集、性能最佳的模型等列出来。

例如当你锁定一篇论文后,就可以点到详情页,看到相关信息。

第三步:读论文

确定完主题、找到合适的论文后,我们终于要开始读了。

每一篇论文的格式实际上都是「八股文」,采用固定的格式进行编写,这种格式既能帮助论文作者梳理思路,也能帮助读者快速定位文章中的创新点。

对于研究新手来说,拿到一篇论文的第一个想法就是从头到尾地把论文读一遍,然后开始做笔记,这种想法虽然无可厚非,但肯定不是最高效读论文的一种方式。

更实用的一种阅读方法是先理解论文研究的背景,「标题」、「摘要」和「结论」部分是快速理解论文内容的三个关键部分。

在第一遍读完论文后需要达成三个目标:

1、确认这篇论文和自己的研究内容是相关的

2、读完论文的内容、方法和结论后,能够对论文的研究背景和意义有所了解

3、认识到文章的主要创新点,总结论文作者的目标、方法和主要贡献

第四步:再读一遍论文

第二遍读论文的主要目的就是熟悉论文的内容。和读第一遍一样,不要直接读论文的核心内容,只有充分了解论文的背景、研究出发点才能更好地理解论文。

第二遍主要从「引言」和「图表」入手。

引言部分概述了研究工作的目标,会解释论文中的问题域、研究范围、先前的研究工作和方法。能够帮助读者找到该领域过去的相似研究工作,为读者拓宽了探索思路,引言部分也为读者提供了理解论文所需的必要知识。

图标的话属于论文中的说明性材料,能够帮助读者理解论文中的研究问题,并对文中所提出的方法进行解释。表格也能够对论文中涉及到的相关方法进行量化分析。

对于深度学习来说,模型架构图也是必不可少的,有时候读一篇论文只看架构图就能理解了文章的主要工作。

第五步:再再读一遍

第三遍要更加深入地读论文,但文章中的公式、不熟悉的术语都可以跳过。

从摘要到结论重新看一遍,在读完每个章节后都休息一下,将所有想法、见解、收获和不熟悉的概念一起记下来。

并且读论文时要有节奏,一个比较有效的学习方法是学50分钟,然后休息15分钟。如此学习两次以后,可以休息30分钟以上来干点别的事。

如果还不熟悉这种节奏的话,可以从学25分钟休息5分钟开始练习。

第六步:再再再读一遍

这次是最后一遍读论文了,但也是最难的、最考验思维和学习能力的一遍。

你需要将前面遇到的所有不理解的、不熟悉的术语、公式、名词、概念、算法都进行深入研究。最重要的就是利用外部资源来帮助理解论文,例如相关文献、搜索引擎、同学的讨论等等。

最后一遍读论文所需时间通常是不固定的,几个小时、几天甚至几周都有可能。并且你在搜索引擎中可能也找不到论文的相关讨论,这就需要你来思考、实践或者联系作者来寻找答案。

第七步:总结

把论文中的内容用自己的话重新总结出来能够帮助你对论文内容加深理解,确保学到的知识可以记得更长远一点。

不管是手写还是打字总结,都能够帮助加强记忆。

毋庸置疑,AI从业人员必须要学会读论文,而初学者往往很难入手。通过这样一遍遍、有规则地读论文,能帮你快速掌握、理解论文中的内容。

参考资料:

https://developer.nvidia.com/blog/how-to-read-research-papers-a-pragmatic-approach-for-ml-practitioners/

点个在看 paper不断!

读论文七步走!CV老司机万字长文:一篇论文需要读4遍相关推荐

  1. 读论文七步走,CV资深博客专家长文:一篇论文需要读4遍

    读论文对于AI新手和工程师来说可能是一件比较难的事.最近一位从业超5年的CV老司机发布了一篇万字长文,讲述了读论文七步法,从找论文到总结,每篇论文由浅入深都需要读4遍. 人工智能从业者需要读论文吗? ...

  2. 全方位掌握Apache Spark 2.0七步走(二)

    2019独角兽企业重金招聘Python工程师标准>>> 在上一篇普及过Spark的相关概念之后,让我们继续深入研究它的核心结构以及好用的API,本篇视频内容丰富,机(fan)智(qi ...

  3. 上云七步走,助力垂直电商降本增效

    甩开技术包袱,做出业务特色,越发成为垂直电商的生存之道 今天,人们通过天猫.淘宝.苏宁进行网络购物,不仅方便,而且快乐,通过盒马.饿了么享受更加快捷的本地生活服务,与此同时,家电.食品等垂直领域的电商 ...

  4. 七步走 Angular.js 从菜鸟到专家 (系列列表)

    Angular.js 是一个MV*(Model-View-Whatever,不管是MVC或者MVVM,统归MDV(model Drive View))JavaScript框架,其是Google推出的S ...

  5. 十字路口待转区什么用_都知道“左转待转区”,但到底该怎么走?老司机给你一次讲清楚...

    对车主们来说,行车安全是最为重要的,即便是驾驶技术最好的老司机也不能忽略这一点.正所谓"常在河边走,哪有不湿鞋",有时候即便再小心,但也不排除发生被剐蹭的情况,尤其是现在新手车主不 ...

  6. 《七步走出职场焦虑©:释放压力,做情绪的主人》

    <七步走出职场焦虑©:释放压力,做情绪的主人> --专为身在职场的你打造 课程讲授:严红艳老师 一.课程缘起: 情绪左右了我们的人生,中国每天会产生5000个职业病人.在一定量的被调查人群 ...

  7. 大学生职业规划:自我分析七步走

    大学生职业规划:自我分析七步走 对于今年的大学毕业生来说,"这个冬天有点冷",在这样的一个社会环境下,大学生更应尽早做好职业生涯规划,认清自我,并不断探索开发自身潜能的有效途径或方 ...

  8. 怎么跳槽?这七步走完,你完全可以面试大厂了

    前阵子,我司的职业顾问们以程序员为例,整理了一份「准备面试七步走」攻略,在之前举办的知乎live 如何更好地准备下一次跳槽? 里分享过,这里重新整理下分享给大家,干货满满,拿走不谢. 第1步:你要知道 ...

  9. 可变车道怎么走不违章_可变车道不敢走?老司机教你正确的行驶方式,再也不怕违章了...

    原标题:可变车道不敢走?老司机教你正确的行驶方式,再也不怕违章了 我国现在的道路交通情况无需做过多的介绍,朋友们每天都在亲身感受,为了缓解这些糟糕的交通状况,交通部门出台了一系列措施,改善交通状况. ...

最新文章

  1. 全面梳理关系型数据库和 NoSQL 的使用情景
  2. 开发过程中的常见问题
  3. 飞桨上线万能转换小工具,教你玩转TensorFlow、Caffe等模型迁移
  4. Java之控制反转和依赖注入
  5. js理解 call( ) | apply( ) | caller( ) | callee( )
  6. 线性代数应用于计算机科学例子,为什么计算机科学家们应该了解量子计算?(三):算法棱镜折射出的科学...
  7. 美丽的字符正方形FINAL
  8. er图用什么软件_太牛逼!一款软件几乎可以操作所有的数据库!
  9. Self-Supervised Curriculum Learning for Spelling Error Correction
  10. 杭电 3400 Line belt 解题报告
  11. springmvc前后端传值总结
  12. Redis学习之lpush命令
  13. Mysql 索引存放位置
  14. Exch:POP3 和 IMAP4 操作指南
  15. 网页加速之Chromium 预加载 Prerendering
  16. 一次错综离奇的super调用的None参数super() argument 1 must be type, not None
  17. Python selenium —— selenium与自动化测试成神之路
  18. outlook服务器上修改文件保存,修改Outlook 2013数据文件(.ost)保存路径的方法
  19. LED驱动芯片TM1668驱动代码
  20. GPS定位与IP地址定位有何不同?

热门文章

  1. 杭电2099 整除的尾数
  2. JS设计模式——3.封装与信息隐藏
  3. 用C#创建Windows服务(Windows Services)
  4. 【青少年编程(第29周)】8月份的青少年编程组队学习结营了!
  5. 【青少年编程】黄羽恒:Python
  6. 刻意练习:LeetCode实战 -- Task15. 有效的括号
  7. LUT 查表反色处理
  8. 【ACM】LightOJ - 1008 Fibsieve`s Fantabulous Birthday (找规律,找...)
  9. 不是“重复”造轮子,百度飞桨框架2.0如何俘获人心
  10. 10年Java老兵宝藏资料,吐血奉献!