普通人CV领域论文创新常见思路与方向总结
点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
作者 | 何杰文@知乎(已授权)
来源 | https://zhuanlan.zhihu.com/p/423273070
编辑 | 极市平台
本文内容:1. 做CV的论文创新的一些思路与方向。分别是无事生非,后浪推前浪,推陈出新,出奇制胜。2. 创新思路形成的学习方法总结。
一、做CV的论文创新的一些思路与方向
1.无事生非
在原始的数据集上加一些噪声,例如随机遮挡,或者调整饱和度亮度什么的,主要是根据具体的任务来增加噪声或扰动,不可乱来。如果它的精度下降的厉害,那你的思路就来了,如何在有遮挡或有噪声或其他什么情况下,保证模型的精度。
用它的模型去尝试一个新场景的数据集,因为它原来的模型很可能是过拟合的。如果在新场景下精度下降的厉害,思路又有了,如何提升模型的泛化能力,实现在新场景下的高精度。
2.后浪推前浪
思考一下它存在的问题,例如模型太大,推理速度太慢,训练时间太长,收敛速度慢等。一般来说这存在一个问题,其他问题也是连带着的。如果存在以上的问题,你就可以思考如何去提高推理速度,或者在尽可能不降低精度的情况下,大幅度减少参数量或者计算量,或者加快收敛速度。
考虑一下模型是否太复杂,例如:人工设计的地方太多,后处理太多,需要调参的地方太多。基于这些情况,你可以考虑如何设计一个end-to-end模型,在设计过程中,肯定会出现训练效果不好的情况,这时候需要自己去设计一些新的处理方法,这个方法就是你的创新。
3.推陈出新
替换一些新的结构,引入一些其它方向的技术,例如transformer,特征金字塔技术等。这方面主要是要多关注一些相关技术,前沿技术,各个方向的内容建议多关注一些。
4. 出奇制胜
尝试去做一些特定的检测或者识别。通用的模型往往为了保证泛化能力,检测识别多个类,而导致每个类的识别精度都不会很高。因此你可以考虑只去检测或识别某一个特定的类。以行为识别为例,一些通用的模型可以识别几十个动作,**但你可以专门做跌倒检测。在这种情况下你可以加很多先验知识在模型中,例如多任务学习。换句话来说,你的模型就是专门针对跌倒设计的,因此往往精度可以更高。**这种特定类的检测最好是有些应用前途,让人觉得现实中可以有。
二、创新思路形成的学习方法总结
以上都是一些针对性的思路,最原始的做法应该是看完方向上比较重要的论文后自己写一个综述,写的过程中往往会发现一些问题,不一定就是要去跟sota模型比精度,而是解决这个方向上还存在的问题。解决还存在的问题才是关键,才是论文的核心价值所在,否则就只是十几页的废纸。
例如前面提到的实现轻量化,提高推理速度,实现实时检测,设计end to end模型,都属于解决这个方向上存在的问题,进一步提高精度也是解决问题,此外还包括一些其他的问题,这个得根据具体任务才能分析。
如果说写完综述后还是没思路,一来是建议尝试以上思路,二来建议找一些跟你方向相关的经典论文看一看,边看边想,这四个字最重要。当然,边看边想要想发挥作用,还需要有个最重要的前提,知识面足够广,否则再怎么想也没用。
很多情况下在模型上加入一些别的方向的模块,例如使用即插即用的模块、注意力机制等,可以使模型有一定的提升,这是算创新的。但需要一个合理的解释为何这么做可以起作用,解决了什么问题。有时候对原模型做一些小的改进,却有较大的提升,这也属于创新。前提是,这种提升是稳定的,是在多个数据集下都有的提升,而不是一次偶然事件。
本文仅做学术分享,如有侵权,请联系删文。
3D视觉精品课程推荐:
1.面向自动驾驶领域的多传感器数据融合技术
2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)
9.从零搭建一套结构光3D重建系统[理论+源码+实践]
10.单目深度估计方法:算法梳理与代码实现
11.自动驾驶中的深度学习模型部署实战
12.相机模型与标定(单目+双目+鱼眼)
13.重磅!四旋翼飞行器:算法与实战
14.ROS2从入门到精通:理论与实战
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~
普通人CV领域论文创新常见思路与方向总结相关推荐
- 精选NLP、CV领域论文TOP10(附链接)
来源:PaperDaily 本文长度为2200字,建议阅读6分钟 本文为你盘点近期值得关注的NLP.CV领域相关论文. 自然语言处理 01 Knowledge Graph Embedding: A S ...
- CV领域论文常用单词汇总
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 作者:王大东 来源:https://zhuanlan.zhihu.com/p/58 ...
- CV领域论文查找方法
https://blog.csdn.net/weixin_36670529/article/details/99710512
- 想快速发表CV/NLP论文?试试这几个方向!
如果你准备发AI方向的论文,或准备从事科研工作或已在企业中担任AI算法岗的工作.那么我真诚的向大家推荐,贪心学院<高阶机器学习研修班>,目前全网上应该找不到类似体系化的课程.课程精选了四大 ...
- 深度学习在CV领域的进展以及一些由深度学习演变的新技术
CV领域 1.进展:如上图所述,当前CV领域主要包括两个大的方向,"低层次的感知" 和 "高层次的认知". 2.主要的应用领域:视频监控.人脸识别.医学图像分析 ...
- 【每周CV论文推荐】 CV领域中数据增强相关的论文推荐
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 数据增强在每一个深度学习项目中都是必要的操作 ...
- 微软亚研院:CV领域2019年重点论文推荐
点击我爱计算机视觉标星,更快获取CVML新技术 微软亚洲研究院是国内顶级CV研究机构,众多CV黑科技的诞生地,2020年始,亚研院盘点了2019年CV领域重点论文,大部分附有开源代码,希望对大家有帮助 ...
- 何恺明:从高考状元到CV领域年轻翘楚,靠“去雾算法”成为“CVPR最佳论文”首位华人得主...
(给机器学习算法与Python学习加星标,提升AI技能) 本文转载自:德先生 根据科学研究,人类大脑皮层的70%活动都在处理视觉信息.如果人工智能赋予机器能够像人类一样思考.处理事情的能力,计算机视觉 ...
- 深度学习CV领域必读论文
深度学习CV领域必读论文 01 深度学习CV领域划时代论文具有里程碑意义 期刊日期: NIPS-2012,Alexnet 论文名称: <ImageNet Classification with ...
最新文章
- 【转】Struts2中转换Date类型的问题
- 使用VSCode调试C#控制台程序
- Kafka如何基于CopyOnWrite实现线程安全的Deque构建
- [转载]OBJECTIVE C (XCODE) 绘图功能简介
- C++STL常用集合算法
- 【翻译自mos中文文章】重建控制文件的方法
- 安卓牛客专项练习2020.12.10
- C语言之文件读写探究(一):fopen、fclose(文件的打开和关闭)
- java final resource_java 中的常量定义,final 的问题
- html点击超链接出现弹窗,如何实现超链接弹窗打开
- 订阅号助手android,微信订阅号助手app
- 单片机入门3.驱动蜂鸣器
- 再战中原之地图编辑器
- Windows应急响应排查
- 基于MATLAB/yalmip/cplex 的机组最优组合
- 修改织梦dedecms后台默认admin账号的方法
- 50. 从暗通道先验去雾到海底图像修复-三维重建辅助计算摄影
- 2022-2028全球与中国自动输送分拣系统市场现状及未来发展趋势
- 科研论文投稿状态解析大全
- 埃森哲杯第十六届上海大学程序设计联赛春季赛暨上海高校金马五校赛 A - Wasserstein Distance