独家采访 | 苹果首篇AI论文获奖遭质疑,是价值有限还是实至名归?
雷锋网AI科技评论按:苹果第一篇AI论文一经投放,便斩获CVPR 2017最佳论文。随后便有外界不断猜测苹果的论文质量有水分,似乎不能匹配最佳论文的头衔。雷锋网记者随后从学术角度采访了几位学术界人士。看看他们怎么说。
苹果的AI研究消息首次进入公众视野的是在去年的12月初。
2016年12月8日,在西班牙NIPS 2016大会上,苹果AI研究负责人Russ Salakhutdinov承诺将会公布和分享他们的最新AI研究成果。
2016年12月22日,首篇机器学习论文通过康奈尔大学图书馆出版,显示的提交时间是11月15日。
2017年7月19日,苹果开通机器学习博客(Apple Machine Learning Journal ),同时发表一篇题为“Improving the Realism of Synthetic Images”的文章。这篇文章用更通俗的语言介绍了之前发表的论文。
2017年7月22日,苹果的这篇论文获CVPR 2017最佳论文。
回顾一下这篇论文的主要内容:
这篇题为《通过对抗训练从模拟的和无监督的图像中学习》是图像识别领域的论文。论文中,提出了一个“模拟+无监督学习”(simulated + unsupervised learning)的学习方法,使用的是如今非常火的深度学习“对抗训练”。GANs(对抗训练)发明者Ian Goodfellow得知苹果的第一篇机器学习论文是关于GANs,也十分兴奋,并在自己的推特中第一时间转了这篇论文。
GANs模型,简单的说就是让两个网络相互竞争,玩一个“猫鼠游戏”。
一个叫做生成器网络G( Generator Network),它不断捕捉训练库里真实图片的概率分布,将输入的随机向量转变成新的样本。一句话,G负责生成假图片。
另一个叫做判别器网络D(Discriminator Network),它可以同时观察真实和假造的数据,判断这个图片到底是不是真的。
G尝试用自己的生成的仿品来“蒙骗”D,而D也不断提高自己鉴别真伪的水平。这样G的造假能力和D的鉴别能力都会越来越高超。
而苹果的“对抗训练”是对原有的GANs模型做了稍加的修改,形成了自己的SimGANs模型。其中sim是单词 Simulator的缩写,即模拟器的意思。
苹果的SimGANs其实包括三部分:模拟器(Simulator)和精制器(Refiner),然后再加上一个判别器(Discriminator)。模拟器合成图像,再用精制器做优化使得更像真实图片,最后再由判别器做识别训练。
苹果也在自己的论文摘要中提到: “我们的模拟+无监督学习方法,使用的对抗网络跟GANs很类似。但是,输入值是合成图像,而不是随机向量。
随后便有学术界人士质疑,指出苹果的创新并不是具有突破性的,似乎不够资格评选为“最佳论文”。
甚至在知名问答社区知乎上有人从论文的第一作者背景开始怀疑,最佳论文评选过程有暗箱操作的嫌疑。
点赞数最多的答主回答:
论文第一作者Ashish Shrivastava,马里兰大学计算机视觉博士
随后雷锋网驻国外记者也就「今年的CVPR 最佳论文是否实至名归」这个问题采访了几位学术界人士:
CrowdAI 研究员Jigar Doshi接受采访说:
(因为总共有两篇最佳论文,他先从第一篇谈起)第一篇Densely Connected Convolutional Networks(密集连接的卷积网络)中,DenseNet模型有两大贡献,一个是计算效率提升,大幅度地减少了参数数量,模型训练出来的精确度和质量都要比之前好。还有就是模型能够泛化,研究者用了好几个数据集,用来展示研究成果可以用到其他数据集和场景中。这是一个大家都能用,一个通用的方法。大家都在看,都在讨论,这篇论文是值得评为最佳论文的。
谈到苹果的SimGANs,Jigar评论到:SimGANs的优点是无需标注自动生成新数据,但是他在演示过程中只用了一个数据集,对它的泛化能力表示存疑。半年前自己也试过类似的方法,不过不起作用,不理解为什么在苹果的试验中起了作用。同时很奇怪为什么这篇论文能评为最佳论文。
南洋理工大学一位研究手势识别的计算机视觉博士评价苹果论文说道:
苹果SimGANs的手势识别效果并不好,还没有自己做的模型效果好。
另一位MIT生物图像博士:
感觉SimGANs并不是很有意义(not very meaningful),相比其他方法并没有很大的提升。
不过也有AI学界人士支持苹果获最佳论文,一位亚马逊研究员告诉记者:
SimGANs 很简单。但也开了一个新口子,针对一个具体问题有了新方法,未来其他人可以研究如何把类似方法用到其他领域,算是“抛砖引玉”。另外,由于该方法的特殊性,需要做许多工作才能用于某一领域,因此确实难以在一个研究中提出一个通用方案,解决一个具体问题已经可以了。
来自国内的一位中科院教授说道:
SimGANs 论文第一作者 Ashish Shrivastava 的导师是 CVPR 大会主席 Rama Chellappa,算是“举贤不避亲”(意思是只要是真正有本领的贤能人才,不管与举荐人是否有关系,都可以正常举荐,让贤能的人才发挥其作用。)雷锋网(公众号:雷锋网)记者也跟其他参会的学生老师提了这个疑问,很多人认为论文评审流程严格,未必有多大不公平。
最后采访的几位大牛总结了一下今年的两篇最佳论文:这两篇论文没什么理论突破,只是技术上的提升改进。同时也表示,今年的CVPR创新突破已经很少,差不多都是在原有的基础上有一点点提升。
雷锋网小结:三位反对苹果获最佳论文的统一看法是:苹果SimGANs的泛化能力差,只能用到具体的某个领域。另外单从表现效果上看,和其他方法相比也没有很大的提升。两位支持者看法是:由于SimGANs方法的特殊性,确实难以形成一个通用方案,不过苹果给出了一个新思路,能启发大家就够了。这届CVPR总体来说没有学术界期待的那种划时代的研究成果出现,苹果论文之所以不那么出色也能从中脱颖而出,恐怕不是苹果“有关系”,而是“矮子里面选高个”的原因吧!
雷锋网
本文作者:杨文
本文转自雷锋网禁止二次转载,原文链接
独家采访 | 苹果首篇AI论文获奖遭质疑,是价值有限还是实至名归?相关推荐
- 6个月为50篇AI论文写摘要,网友:这有啥,我曾被要求1.5小时内复现一篇论文...
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源丨机器之心 编辑丨极市平台 导读 快速阅读论文是研究人员不可或缺 ...
- 近20年3867篇AI论文大调研:有缺陷的指标被滥用,好的指标被忽视
来源:AI科技评论 本文约5400字,建议阅读6分钟. 论文调查告诉你评估机器学习模型中的不足. "用于评估AI和机器学习模型的常用指标不足以反映这些模型的真实性能",来自维也纳医 ...
- 超赞!2021年最惊艳的38篇AI论文!
转载于 :新智元 1.Zero-Shot Text-to-Image Generation https://arxiv.org/pdf/2102.12092.pdf 文本到图像的生成传统上侧重于为固定 ...
- LoveLive!出了一篇AI论文:生成模型自动写曲谱
视学算法报道 编辑:泽南.小舟 我们终于知道那些折磨人的乐谱是怎么来的了 -- 都是 AI 生成的. 知名偶像企划 LoveLive! 发 AI 论文了,是的没错. 最近,预印版论文平台 arXiv ...
- GAN独领风骚!盘点2021最惊艳38篇AI论文
来源:新智元 [导读]2021年是人工智能继续突飞猛进的一年.近日,Github上有人总结出了今年最有趣.最惊艳的38篇关于AI和机器学习论文,值得收藏. 1.Zero-Shot Text-to-Im ...
- 【学术相关】Github大盘点!2021年最值得推荐的38篇AI论文
新智元报道 来源:Github 编辑:David [导读]2021年是人工智能继续突飞猛进的一年.近日,Github上有人总结出了今年最有趣.最惊艳的38篇关于AI和机器学习论文,值得收藏. ...
- 机器学习论文推荐 | 2019 Reddit最受喜欢的5篇AI论文
By 超神经 内容一览:回顾 2019 年,人工智能领域时有大事发生,吸引着各界人士的关注.这一年,也诞生了数篇优质论文.我们收集了 Reddit 上网友 2019 最喜欢的论文,供大家一起分享.学习 ...
- 2021 年不可错过的 40 篇 AI 论文,你都读过吗?
来源:机器之心 编辑:蛋酱 虽然世界仍在从新冠疫情的破坏中复苏,人们无法向从前那样时常线下相聚.共同探讨交流关于学术领域的最新问题,但AI研究也没有停下跃进的步伐. 转眼就是2021年底了,一年就这么 ...
- 本周值得读的15篇AI论文,还有源码搭配服用
在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...
最新文章
- BCB 编写 DLL 终极手册
- zabbix3.0 监控php,CentOS 6.8 搭建Zabbix 3.0.3监控系统
- oracle 单表查询 详细图文
- 系统提示一个程序正在被另一个程序调用,如何知道是被哪个程序调用
- jq阻止事件冒泡(点击子级不触发父级)的两种方法
- Adaline神经网络简单介绍和MATLAB简单实现
- JSP:src路径里有中文,产生乱码问题
- python和java哪个好-Python和Java哪个好?有什么区别?
- Linux使用docker安装RabbitMQ一站式教程【图文教程】
- Android高手进阶:Adapter深入理解与优化
- linux后台运行程序(secureCRT断掉或关闭后继续运行程序)
- 服务器控制口协议,服务器管理ipmi接口协议的扩展方法 Extension Methods server management interface protocol ipmi...
- Pr 入门教程如何使用精确的剪辑蒙版?
- 面包板电源线怎么接_如何维修面包板电源
- 连续9年惠及10万贫困家庭 金科“情暖万家”春节送温暖再出发
- Spring-Cloud-Gateway之代码注入漏洞及解决
- Python合并PDF
- hadoop相关软件下载地址
- python 线程终止后再启动
- python123课题的答案_python 练习 选课系统 项目
热门文章
- 项目总结之论员工的自我修养
- 关于京牌“以家庭为单位摇号”“京牌可以继承”的不合理性分析
- flutter 设置背景图片
- add python to environment,Python 安装
- matlab院校,MATLAB要来了?!
- 从下象棋的角度来类比浅析H.264中的像素残差和运动矢量残差
- python一个tab键是几个空格_python中tab键是什么意思
- 企业ERP软件在印度,ERP软件在非洲的利益
- 转:人的认识如何自我超越
- UART中的硬件流控RTS与CTS