视学算法报道

编辑:魔王

转载自公众号:机器之心

LSTM 之父、深度学习元老 Jürgen Schmidhuber 发文纪念 10 年前发表的研究。

Jürgen Schmidhuber 每次发博客都会引起一阵「腥风血雨」,这次似乎也不例外。

最近,这位机器学习大牛发布博客,纪念 10 年前发表在 Neural Computation 期刊上的一篇论文《Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition》,这篇文章主要介绍通过在 GPU 上执行梯度下降来训练深度多层感知机。

论文地址:https://www.catalyzex.com/paper/arxiv:1003.0358

在博客开头,Jürgen 这样评价该论文:

令人惊讶的是,这个简单但深层的监督式神经网络在机器学习基准数据集 MNIST 上的性能超过所有之前的方法。也就是说,在计算成本相当于今天 100 倍的 2010 年,我们提出的前馈神经网络和更早提出的循环神经网络就在当时的重要问题上打败了所有竞争算法。2010 年代,这一深度学习改革迅速从欧洲向美洲和亚洲扩展。

博客的具体内容如下:

仅仅在十年前,很多人认为深度神经网络在不进行无监督预训练的情况下无法学习。事实上,2007 年 Geoffrey Hinton 在《The Next Generation of Neural Networks》讲座中表示「明智的人不会建议」通过反向传播使用梯度下降来训练具备多层神经元的前馈神经网络(FNN)。

但在 2010 年 3 月,Jürgen 团队证明了,深度前馈神经网络确实可以通过反向传播训练得到,并且既不需要无监督预训练,也不需要 Ivakhnenko 1965 年提出的渐进式逐层训练。

按照 2010 年的标准,Jürgen 团队创建的监督式神经网络具备很多层,并在当时广泛使用的图像识别基准数据集 MNIST 上创造了新的性能记录。这是通过在高速并行 GPU 上大幅加速传统多层感知机而实现的,超越了 Jung & Oh (2004) 的重要工作(《GPU implementation of neural networks》)。有人称它「唤醒了机器学习社区」。

这一研究结果为最近十年的深度学习发展奠定了基础。2011 年 2 月,Jürgen 团队将该方法扩展至深度卷积神经网络,极大地改进了之前的工作。这个被称为 DanNet 的网络打破了多项基准记录。2011 年 5 月,DanNet 成为首个获得计算机视觉竞赛的深度 CNN 网络。2011 年 8 月,它首次以超越人类的性能获得计算机视觉竞赛(IJCNN Traffic Sign Recognition Competition of INI/RUB)的冠军。2012 年,Jürgen 团队继续在多项计算机视觉赛事中夺冠。之后,很多研究者也采用了这项技术。2015 年 5 月,Jürgen 团队首次创建了具备 100 多层的深度前馈神经网络。

图源:http://people.idsia.ch/~juergen/computer-vision-contests-won-by-gpu-cnns.html

这些成功需要对 GPU 的内在工作原理有准确的理解。现在,便捷的软件包使用户远离了这类细节。计算成本也比十年前廉价得多,很多商业神经网络应用都基于 2010 年的研究 [MLP1] [DL1-4] [DEC]。

在这样的背景下需要提及的是,2010 年代之前,Jürgen 团队已经利用更强大的循环神经网络获得了另一项监督式深度学习突破。Jürgen 的博士生 Alex Graves 在著名文档分析与识别会议 ICDAR 2009 上获得了 3 项连笔字竞赛的冠军。他结合了 Jürgen 研究小组在慕尼黑工业大学和瑞士人工智能实验室 IDSIA 提出的两种方法:监督式 LSTM RNN (1990s-2005) 和「Connectionist Temporal Classification」(CTC)。CTC 训练的 LSTM 是首个在国际赛事中夺冠的 RNN。

2010 年,Jürgen 团队的监督式 FNN 和监督式 RNN 在多个重要问题上超越其他方法。2010 年代,这一监督式深度学习改革训练从欧洲扩展至北美和亚洲,对业界和人们的日常生活产生了巨大影响。但应该提及的是,深度学习的概念根源可以追溯至上个世纪。

最后,Jürgen 强调了 2010 年代监督式深度学习改革并没有杀死无监督学习的所有变体。很多仍然非常重要,例如现在在迁移学习语境下得到大量应用的预训练语言模型,如 BERT。1990 年之后 Jürgen 团队关于无监督神经网络的研究目前仍用于为智能体赋予好奇心。

在博客的结尾,Jürgen 表示:「无监督学习仍然有光明的未来!」

一如既往:Jürgen 出手,必有争论

这篇博客发布后不久,就在 reddit 上引发热议。

针对 Jürgen 近年来的行为(与 Ian Goodfellow 争辩 GAN 的归属、与 Hinton 论战等),有网友开启了嘲讽模式:

他还要一直提醒你这件事,直到你离开这个世界。

当然,也有人支持他:

Schmidhuber 被低估了,他的工作走在了潮流前面。

关于 Jürgen 在博客中指出 Hinton 2007 年不赞同使用反向传播一事,有网友表示:

2007 年不相信一件事,2008 年不能改变主意吗?

除去这些表层的争论以外,关于该博客的主题——Jürgen 团队 2010 年的研究《Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition》及其扩展后提出的 DanNet,有网友提出疑问:

这么说的话,AlexNet 不像大家认为的那样是转折点吗?

参考链接:

http://people.idsia.ch/~juergen/2010-breakthrough-supervised-deep-learning.html

https://www.reddit.com/r/MachineLearning/comments/il2iw0/d_2010_breakthrough_of_supervised_deep_learning/

© THE END

转载请联系 机器之心 公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

Jürgen Schmidhuber发文纪念10年前的研究,网友:转折点非AlexNet?相关推荐

  1. Jürgen Schmidhuber回顾30年前旧作,称其启发了现今流行的很多概念

    来源:机器之心本文约3300字,建议阅读7分钟本文回顾了 30 年前其团队发表的关于利用人工进行规划和强化学习的研究工作. 现今流行的生成对抗网络(GAN)只是对抗好奇心的一种特例?在近日 Jürge ...

  2. Jürgen Schmidhuber眼中的深度学习十年,以及下一个十年展望

    大数据文摘出品 来源:Medium 作者:Jürgen Schmidhuber 编译:张秋玥.马莉 2020年是充满科幻的一年,曾经我们畅想飞行汽车.智能洗碗机器人以及能自动写代码的程序,然而这一切都 ...

  3. 乔布斯诞辰64周年 库克发文纪念:我们每一天都怀念他

    [TechWeb]2月25日消息,据国外媒体报道,当地时间周日是苹果联合创始人.前CEO史蒂夫·乔布斯诞辰64周年,苹果现任CEO蒂姆·库克这一天也在推特发文纪念乔布斯,表示他们每一天都怀念他. 史蒂 ...

  4. 杜克大学2年前的研究上热搜!单身竟然还老得快?太难了!!!

    来源:新智元 现代人是越来越喜欢单身了. 每当看到身边的朋友在恋爱.婚姻中一地鸡毛,单身狗们都会暗自庆幸:「还好我单身」. 而面对父母.七大姑八大姨的催婚,看着他们自己也整不明白的婚姻中的鸡零狗碎,更 ...

  5. 啪一下子回到了10年前的B站,我泪目了

    10年前的B站页面长啥样? 估计很多小伙伴都已经忘记了叭. 作为一个当时刚上大学不久就曾混迹于B站的老二刺猿,那时候还只能刷网页版的B站,当时的页面可能差不多还长这样: 还记得那时候B站首页可没有现在 ...

  6. 程序员B站项目分享:啪一下子回到了10年前的B站,要泪目了

    这是一篇CodeSheep的文章,可以说是满满的回忆 : 10年前的B站页面长啥样? 估计很多小伙伴都已经忘记了叭. 作为一个当时刚上大学不久就曾混迹于B站的老二刺猿,那时候还只能刷网页版的B站,当时 ...

  7. 10年前,三星差点收购了安卓

     10年前,三星差点收购了安卓 摘要:"你和这支所谓的团队就打算开发这么个玩意儿?你们(开发产品的)只有6个人,你嗑药嗑嗨了吗?""这基本就是他们的回应." ...

  8. 10年前腾讯微信后台第一天提交的代码曝光!

    点击上方 好好学java ,选择 星标 公众号 重磅资讯.干货,第一时间送达 今日推荐:硬刚一周,3W字总结,一年的经验告诉你如何准备校招! 个人原创100W+访问量博客:点击前往,查看更多 编辑:卫 ...

  9. 10年前用10万元投资腾讯,现在能实现财务自由吗?

    10年前10万块钱投资腾讯股票,现在根本就实现不了财务自由. 我们先来计算一下,2008年用10万块钱投资腾讯现在值多少钱. 2008年正值世界金融危机的时候,所以当时腾讯的股票也受到了较大的波动,股 ...

最新文章

  1. java 清空控制台_利用原生库和JNI(Java原生接口)实现H2数据库漏洞利用
  2. 面对互联网一线大厂,这些技术你需要了解!
  3. 小米豪派大红包!向几千名员工发放股权激励,人均39万,应届生都有!小米员工却吵翻天:不公平,作秀!...
  4. android ios 上传图片到服务器,.net 接收ios, android的上传图片
  5. AutoHotKey Script AHK脚本++Topre Realforce 104Pro十周年纪念版静电容键盘
  6. 安装交叉工具链arm-linux-gcc
  7. 最简单的基于FFmpeg的移动端例子附件:SDL Android HelloWorld
  8. cximage函数总结
  9. MP4BOx hint等常用命令
  10. 端到端和非端到端的Embedding,以及embedding质量评估
  11. 服务器里面增加单页网站,如何设计完美的单页网站
  12. 企业微信SCRM会员营销 您的私域流量池精细化运营平台
  13. android文件管理器——文件检索
  14. win10c语言0xc0000142,Win10错误码0xc0000142怎么修复
  15. IOS模拟用户触发各种事件
  16. 视频播放–AVPlayer
  17. 用 CPU 烤出来的肉,会特别香吗?
  18. jks文件转换keystore
  19. solr的DIH操作同步mysql数据
  20. MyCAT数据库分片(一)

热门文章

  1. 【组队学习】【35期】动手学数据分析
  2. 中国电子学会青少年编程能力等级测试图形化四级模拟题
  3. 刻意练习:Python基础 -- Task12. 模块
  4. 如何利用 C# 爬取Gate.io交易所的公告!
  5. 如何利用神经网络结合遗传算法进行非线性函数极值寻优(2)
  6. NLP被英语统治?打破成见,英语不应是「自然语言」同义词
  7. 你是“10倍工程师”吗?这个事,​国外小伙伴们都快“吵”起来了
  8. Java 11 正式发布!
  9. AI一分钟 | 黎曼猜想已被证明?对错有待同行评议;讯飞与发帖质疑同传译员达成谅解...
  10. ICCV2017 | 一文详解GAN之父Ian Goodfellow 演讲《生成对抗网络的原理与应用》(附完整PPT)