来源丨量子位

编辑丨极市平台

导读

如何在机器学习领域写论文时保证创新性?

机器学习领域水写论文日常:

图源推特:AI Memes for Artificially Intelligent Teens

明明想得很美:要提出一个更好的新架构、新损失函数、新优化器或激活函数……

而实际正在做的呢?

在一个数据集上应用现有的东西(如架构,优化器,损失功能),尝试不同的组合以找到该数据集上的最优解。

这就是Reddit上的一位准博士现阶段的烦恼:

他并不满意目前的工作,也不知道自己都做了哪些贡献。

所以帖子标题非常直接:

如何在机器学习领域写论文时保证创新性?

关注现实问题和细分领域

而对于这一问题,下方讨论的网友们基本分为了两类。

第一类认为,不要刻意去追求“创新”,而是先尝试从解决现实问题出发:

一个新想法的出现,通常是为了试图解释一些以前没有解决的问题。

或是这一问题已有方法(但你找到了更好的解决方案)。

现实中确实有很多这样的例子。

比如强化学习领域的很多论文都是集中在游戏上的。

造成这种现象的原因之一,就是大家在一开始都是用较低的成本让模拟器快速运行的。

但慢慢地,这种传统方法就让游戏暴露出了不少问题:

比如,只有在执行了一长串的正确行动(actions)后,你的(强化学习)模型才能得到奖励信号(reward signals)。

像这种实际应用中的困难,很容易就能引申到“要如何解决”或“怎么让现有方法变得更好”上。

那创新点不就来了?

第二类网友则直接从问题根源入手:

别再在ML大领域里浪了,赶紧选个利基领域 (niche area)上吧。

什么是利基领域?

这是指一个大领域下尚未被其他人所占领的某个专业的小领域,也叫细分领域。

这一类网友觉得,你要在机器学习领域内创新,那就意味着要跟成千上万的科研人竞争,这谈何容易?

所以还不如去一些“过气”的分支领域去试试。

比如30年前在AI领域中流行过的归纳逻辑程序设计(ILP):

当然,这种方法更适用于当你的目标是“获得博士学位就算成功”的时候。

毕竟这样做很可能导致你的引用数常年在个位数打转……

最后就是Just Try it的保留节目了:

就算最后失败了,你也会对相关问题有更深的理解,或产生新的思考。

同时,这也能侧面印证你选择的课题是不是真的有价值:

毕竟对于牛逼的课题,即使失败也是成功的垫脚石。

但如果你完全无法从这次失败中收获新的东西的话——

那还是赶紧跑路另择idea吧。

永恒的难题:idea

其实今天开贴的这位题主所说的“保证论文创新性”,说到底还是一个idea的问题。

而对于广大科研人来说,这是个永恒的话题。

比如说19年时,就有这种“发现自己的idea已经被人发表了该怎么办?”的讨论帖了:

(只听标题都是闻者伤心听者落泪)

大家在下面集思广益了半天,从如何避免撞车,到撞车之后如何扩展强化,再到个人能力培养和学术环境,最后表示:

凑合一下,克服一下,适应一下。

而在去年,来自清华的高天宇同学也在直播中分享了他的idea来源:

这位本科期间就发表过两篇AAAI和两篇EMNLP的大神表示:

idea的形式多种多样,有原创的突破性工作,就像发明衬衫;也有排列组合、迁移、渐进的补充性工作,就像给衬衫装上纽扣和前衣口袋;而灌水就像是在衣服背后缝了个口袋。

今年,甚至有位英国教授专门写了篇论文来指导大家如何写论文:

作者主要从建模前如何准备、如何建出可靠的模型、如何稳健地评估模型,如何公平地比较模型以及如何报告结果五个方面,全面阐述了如何避免机器学习研究中的陷阱。

那么最后,你觉得还有什么保证论文创新性(或寻找idea)的方法呢?

清华特奖高天宇:
https://www.qbitai.com/2020/03/12309.html

如何写一篇不水的机器学习论文:
https://www.qbitai.com/2021/08/27616.html

发现自己的idea已经被人发表了,该怎么办?
https://www.qbitai.com/2019/06/3337.html

参考链接:
https://www.reddit.com/r/MachineLearning/comments/p4pv17/d_how_to_bring_novelty_in_machine_learning/

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

无贡献、无创新、无思路,ML领域准博士求助:论文到底要怎么创新? | Reddit热议...相关推荐

  1. 无贡献、无创新、无思路,ML领域准博士求助:论文到底要怎么创新?

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源丨量子位 编辑丨极市平台 导读 如何在机器学习领域写论文时保证创 ...

  2. 创新无界 致胜边缘 戴尔OEM助力客户实现能源转型

    众所周知,能源是国民经济发展的重要支撑,当前能源行业正面临着多重挑战:一方面,能源需求在显著增长,预计在未来八年中,新材料能源消费者将超过10亿:另一方面,能源行业需要在大幅减少温室气体排放的同时,采 ...

  3. 无血清培养基概念、无血清培养基品牌大合集

    无血清培养基是在合成培养基的基础上发展起来的,与传统的培养基相比,既能满足细胞在体外长时间培养的要求,又能避免动物血清所带来的不利因素. 无血清培养基的发展历程分为无血清培养基(Serum-Free ...

  4. 自动开料机器人_工业4.0智能家具无人化生产线 自动化无人化大势所趋

    品脉数控工业4.0智能家具无人化生产线 自动化无人化大势所趋 工业4.0自动化生产连线 品脉数控紧随社会的前进步伐,数控积极响应国家智能制造2025号召,推动中国定制家具自动化革命,把板式家具生产智能 ...

  5. 数据调度系统中有向无环图的无环检测

    数据调度系统中有向无环图的无环检测 名词解释 DAG,全称:Directed Acyclic Graph,中文:有向无环图 入度:有向图中某点作为图中边的终点的次数之和 出度: 对于有向图来说,顶点的 ...

  6. 无监督学习中的无监督特征学习、聚类和密度估计

    无监督学习概述 无监督学习(Unsupervised Learning)是指从无标签的数据中学习出一些有用的模式,无监督学习一般直接从原始数据进行学习,不借助人工标签和反馈等信息.典型的无监督学习问题 ...

  7. Rust语言——无虚拟机、无垃圾收集器、无运行时、无空指针/野指针/内存越界/缓冲区溢出/段错误、无数据竞争...

    2006年,编程语言工程师Graydon Hoare利用业余时间启动了Rust语言项目.该项目充分借鉴了C/C++/Java/Python等语言的经验,试图在保持良好性能的同时,克服以往编程语言所存在 ...

  8. 无锁数据结构三:无锁数据结构的两大问题

    实现无锁数据结构最困难的两个问题是ABA问题和内存回收问题.它们之间存在着一定的关联:一般内存回收问题的解决方案,可以作为解决ABA问题的一种只需很少开销或者根本不需额外开销的方法,但也存在一些情况并 ...

  9. RoHS、无铅制程、无卤 的基本介绍

    一.RoHS是欧盟对电子电器产品不能超标含有某些有害物质的禁令:在具体产品生产中,从原材料的选择.采购到制程中可能会污染产品(和产品接触)的生产辅助材料,都必须不能超标含有(有最大允许浓度)Pb(铅) ...

最新文章

  1. SSC:面向大规模场景识别的语义扫描context(IROS2021)
  2. Daily Scrum 11.5
  3. 使用jquery的getJSON从服务器端获得数据
  4. Linux 下的KILL函数的用法
  5. (jmeter内置可调用的变量)jmeter beanShell断言
  6. 【渝粤题库】国家开放大学2021春2247社会工作政策法规题目
  7. wxpython实现界面跳转
  8. 自旋锁、排队自旋锁、MCS锁、CLH锁
  9. python snap7 plc_Python-Snap7获取西门子PLC 300数值
  10. 01.Unity设置成为中文
  11. CAD的.net开发
  12. python创建excel并冻结首行
  13. express router路由管理中间件
  14. 创意h5案例作品展示:谁是王牌拆弹专家
  15. 双硬盘装linux系统,在我的双硬盘windows电脑上安装ubuntu18.04
  16. 离线语音芯片-开发指南
  17. 最佳光圈值 (Optimum Aperture)
  18. QListWidget的 和 QListWidgetItem的颜色设置
  19. Android 应用ttf字体
  20. qpython 3h_python 逆向某咖啡小程序接口

热门文章

  1. 淘宝客户端诊断体系升级实战
  2. 字节跳动项目管理面经
  3. 怎样处理PDF文件过大?如何压缩PDF文件大小
  4. mac QQ操作技巧
  5. Tcl-5. format 命令
  6. php soap xml参数,php soap基础知识(1)
  7. 演讲培训经典句子分享
  8. 灵遁者:时空一体化和能量守恒,决定了时间存在起点的观点值得怀疑
  9. 无法启动T-SQL调试,未能连接到计算机,工作站服务没有启动
  10. 充分利用计算机在教学中的作用,论计算机领域在教学中的应用