https://www.toutiao.com/a6688201699858842119/

2019-05-07 16:38:26

神经网络技术起源于上世纪五、六十年代,当时叫感知机,拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果。

尽管人工智能取得了很大的进步,但现在大多数基于人工智能的产品仍然依赖于“深度神经网络”。这种网络通常非常大,而且训练成本高得令人望而却步。

麻省理工学院的研究人员希望改变这一现状。在今天发表的一篇论文中,研究人员揭示了神经网络中包含的“子网络”,比之前的网络小10倍,而且可以更便宜、更快地进行训练。

为了训练大多数神经网络,工程师给它们提供大量的数据集,但这可能需要几天的时间和昂贵的GPUs。

来自麻省理工学院计算机科学和人工智能实验室(CSAIL)的研究人员发现,在这些训练有素的网络中,有更小的子网络,可以做出同样准确的预测。

CSAIL所谓的“彩票假说”就是基于这样一种观点,即训练大多数神经网络就像买所有的彩票,以确保中奖。相比之下,训练子网就像只买有奖的那张彩票一样。

问题在于,研究人员还没有想出如何在不构建完整神经网络的情况下找到这些子网,然后修剪掉不必要的位。研究人员目前还没有找到这些子网络的方法。

如果他们能找到一种方法跳过这一步,直接进入子网络,那么这一过程可以节省数小时的工作。并使训练神经网络不仅仅对大公司开发而且对单个程序员开放。

但是,如何有效地找到子网络,并明确为什么有些子网在训练上比其他子网表现地更好,可能会让研究人员忙上几年。

麻省理工人工智能实验室发现更小更容易训练的神经网络相关推荐

  1. 麻省理工人工智能实验室新研究!有远见的机器学习方法:能预知未来行为的AI智能体

    原创/文 BFT机器人 近日,麻省理工学院的研究人员开发出一种新技术,让AI智能体能够思考更远的未来,寻找更合适的合作与竞争长期解决方案. 想象一个游戏规则:两支足球队在球场上PK,玩家们可以选择相互 ...

  2. MIT Artificial Intelligence —— Patrick H. Winston 麻省理工人工智能公开课学习笔记(一)

      本系列文章是博主对网易公开课中麻省理工人工智能课程的学习笔记,在此方便学习和分享. Lecture 1: Introduction and Scope   本节课程大概从这三方面讲述:   一.什 ...

  3. Google 开源的依赖注入库,比 Spring 更小更快!

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试资料 来源:GinoBeFunny zhuanlan.zhihu.com ...

  4. 苹果公司提出Mobile-ViT | 更小更轻精度更高,MobileNets或成为历史

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨ChaucerG 来源丨集智书童 MobileviT是一个用于移动设备的轻量级通用可视化Tran ...

  5. 海尔微型计算机云悦mini2a,更小更轻新 主机云悦mini2A参数曝光

    大哥大流行的年代,没人能想到手机能发展到多小,世界上第一台30吨重的计算机诞生时,也没人能想到主机能发展到只有一瓶矿泉水的重量.海尔电脑旗下的云悦mini可谓主机进化史上的缩影,0.6L体积,0.45 ...

  6. hp510台式计算机,体积更小更时尚 惠普Pavilion 510台式机简评

    体积更小更时尚 惠普Pavilion 510台式机简评 2016年07月13日 01:00作者:王普编辑:王普文章出处:泡泡网原创 分享 随着DIY市场的萎靡,PC行业早已没有当年那番景气,但是大家对 ...

  7. EfficientNet v2网络学习记录--更小更快

    论文地址:2021 CVPR --Google <EfficientNetV2: Smaller Models and Faster Training> 亮点: 使用训练感知神经结构搜索和 ...

  8. 尺寸直降28%!斯坦德推出更小更灵活的AMR物流机器人

    经由客户项目现场测试打磨,结合3C制造场景下产线空间受限等挑战,斯坦德推出了新型号AMR物流机器人--Oasis300C.该型号AMR延续了同系列产品功能设定,同时凭借更小的体型在更多极限场景与运动控 ...

  9. 蜂鸟视图JS SDK v3.0:五大亮点,打造更小更快的可视化地图应用

    近期,蜂鸟视图发布了FengMap JavaScript SDK v3.0版本,该版本在不减少任何功能的情况下,对原有的渲染内核进行了优化,使得数据加载性能提升了30%,渲染性能提升了25%,包体大小 ...

最新文章

  1. 最全的 Spring 依赖注入方式,你都会了吗?
  2. 李飞飞高徒Andrej Karpathy用AI撰写内心独白:我的“进化”之路
  3. 【华科考研机试题】最长最短文本
  4. 通过Docker发布RestAPI遇到的种种问题
  5. 动画电影的幕后英雄怎么说好_幕后编码面试-好与坏
  6. canvas反向裁剪技巧
  7. 数据结构Java版之排序算法(二)
  8. appium+Python真机运行测试demo的方法
  9. 深度学习面试题及参考答案
  10. Jmeter 使用详解
  11. 西安网络安全周 | 联软科技:论端点安全在零信任体系中的重要性
  12. 比较有用的若干EXCEL常用函数
  13. 发票管理系统java_企业发票管理系统.doc
  14. sparkstreaming的实时黑名单过滤太慢
  15. 潜心研究即时通讯软件,基于企业im源码 分享
  16. 如何提高Bug敏感度
  17. 上传项目到开源中国码云
  18. 农产品电子商务行业调研报告 - 市场现状分析与发展前景预测
  19. 小程序影藏溢出的gif_迅捷GIF制作工具-简单的GIF制作软件,支持视频转成GIF
  20. 漫谈程序员系列:无BUG不生活

热门文章

  1. jupyter !wget 等系统命令使用技巧
  2. 对tf.reduce_mean API的理解就是求平均值,reduce指的是一串数据求平均值后维数降低了,可不是吗,一串向量变成了一个数,维数自然降低了
  3. JAVA 文件读写大全
  4. 如何网络监测其他计算机关闭445端口,关闭445端口的方法,教您电脑如何关闭445端口...
  5. html表格td宽度设置,table以及td宽度设置细节
  6. 智源博士后合作导师专访 | 曾毅:面向可持续发展的人工智能
  7. 终于!有本书把我从“看完就忘、死记硬背”的学习困境中拯救出来了!
  8. 谷歌服务中断事故能否避免?
  9. 基于深度学习的目标检测的研究进展2
  10. 大数据竞赛平台——Kaggle 入门篇