新智元报道  

来源:venturebeat

编辑:雅新

【新智元导读】方舟投资的最新一项报告指出,AI训练成本从2017年至2019年下降了100倍,但人工智能发展尚处于初期阶段。该报告同时发现AI算法效率每16个月翻一番,与OpenAI的报告结果一致。

机器学习训练系统越来越便宜了。

方舟投资(ARK Invest)近日发布了一篇分析报告显示,AI训练成本的提高速度是摩尔定律(Moore’s law)的50倍。摩尔定律是指计算机硬件性能每两年提升一倍。

两年间,AI训练成本下降了100倍

方舟评估委员会在其报告中发现,从1960年到2010年,按照摩尔定律,用于训练的AI算力翻了一番。人工智能计算的复杂度自2010年以来每年飙升10倍(每秒千万亿次运算)。与此同时,过去三年的训练成本每年下降10倍。2017年,在公共云上训练像 ResNet-50这样的图像分类器的成本约为1000美元,到了2019年只需大约10美元。方舟评估委员会预测,按照目前的速度,到今年年底,其训练成本应降至1美元。该公司预计,随着这一成本的下降,推理的成本(在生产过程中运行一个训练有素的模型)将会下降。比如,在过去两年中,对十亿张图像进行分类的成本从10,000美元降至仅0.03美元。对于那些与像谷歌、DeepMind 这样资金雄厚的公司进行竞争的初创公司来说,这无疑是天籁之音。DeepMind 去年亏损5.72亿美元,且背负着超过10亿美元的债务。尽管一些专家认为,科技巨头无可匹敌的实验室有能力从事新的研究,但训练成本也是AI工作中不可避免的开支,不论是在企业、学术界还是其他领域。

AI算法效率每16个月翻一番,与OpenAI报告结果一致

方舟投资的这些发现似乎与 OpenAI 最近一份报告的发现结果一致。OpenAI 的报告指出,自 2012 年以来,人工智能模型在 ImageNet 分类中训练神经网络达到相同性能所需的计算量,每 16 个月减少了 2 倍。OpenAI观察到16个月AI模型的效率倍增时间(任意给定时间的最低计算点用蓝色表示,测量点用灰色表示)据 OpenAI 介绍,它发现谷歌的 Transformer 架构超越了以前由谷歌开发的最先进模型——seq2seq,在seq2seq推出三年后,其计算量减少至原来的1/61。谷歌的 Transformer 架构超越了之前的最先进模型—— seq2seq,后者也是谷歌开发的,在 seq2seq 推出三年后,计算能力下降了61倍。Deepmind 的 AlphaZero 是一个从零开始自学如何掌握国际象棋、将棋和围棋游戏的系统。仅仅一年后,DeepMind 的 AlphaZero 在围棋比赛中,其计算量比 AlphaGoZero 少 8 倍,就能与 AlphaGoZero 匹敌。

AI发展尚处于初期阶段,训练最先进AI模型的成本依然惊人

方舟投资报告指出, 硬件和软件的突破使得AI训练成本下降。

在过去的三年中,芯片和系统的设计不断发展,为深度学习添加了专用硬件,从而使性能提高了16倍。例如, Nvidia于2017年发布的 V100显卡,比三年前发布的 K80 快1800%  (显卡通常用于训练大型人工智能系统) 。在2018年至2019年间,由于麻省理工学院、谷歌、 Facebook、微软、 IBM、 Uber 等公司的软件创新,V100的训练性能提高了大约800% 。ARK 分析师 James Wang 写道,「从AI训练成本下降的速度来看,人工智能发展还处于初期。」摩尔定律的第一个十年里,晶体管数量每年翻一番。我们在人工智能训练和推断中看到从10倍到100倍的成本下降表明,人工智能的发展尚处于初级阶段,未来几十年可能会出现较慢但持续的增长。值得注意的是,虽然AI模型训练的费用似乎在下降,但是在云中开发复杂ML模型仍然昂贵得让人望而却步

根据 Synced 最近的一份报告,华盛顿大学的 Grover 专门用于生成和检测虚假新闻,训练最大的Grover Mega模型的总费用为2.5万美元。OpenAI 花费了1200万美元来训练它的 GPT-3语言模型。而谷歌花费了大约6912美元来训练 BERT,这是一种双向变换模型,它重新定义了11种自然语言处理任务的最新技术。参考链接:https://venturebeat.com/2020/06/04/ark-invest-ai-training-costs-dropped-100-fold-between-2017-and-2019/https://ark-invest.com/analyst-research/ai-training/

invest模型_ARK Invest最新报告 :AI训练成本下降了100倍,但训练最先进AI模型的成本惊人...相关推荐

  1. 单机训练速度提升高达640倍,快手开发GPU广告模型训练平台

    作者|廉相如(快手FeDA智能决策实验室 ) 如何有效处理大规模用户数据进行广告推荐?对于互联网企业的发展和进步至关重要.这也是为何快手成立西雅图实验室并实现新一代GPU广告模型训练平台的原因之一.快 ...

  2. 网络运行时间提高100倍,Google使用的AI视频理解架构有多强?

    译者 | 刘畅 出品 | AI科技大本营(ID:rgznai100) 视频理解是一个很有挑战性的问题.由于视频包含时空数据,因此图像的特征表示需要同时提取图像和运动信息.这不仅对自动理解视频语义内容有 ...

  3. 英特尔将推Nervana神经网络处理器,要让DL训练提速100倍

    维金 编译整理 量子位 出品 | 公众号 QbitAI 在人工智能热潮刚刚兴起时,英特尔好像并不积极.不过现在,英特尔正试图通过一系列新芯片来加强在这个领域的地位. 最新的进展是:英特尔准备发布Ner ...

  4. AI计算量每年增长10倍,摩尔定律也顶不住 | OpenAI最新报告

    2019-11-08 12:32:54 晓查 发自 凹非寺  量子位 编译 | 公众号 QbitAI 今天OpenAI更新了AI计算量报告,分析了自2012年以来AI算法消耗算力的情况. 根据对实际数 ...

  5. 《预训练周刊》第66期:智源2022大模型创新论坛、 ChatGPT手把手debug代码、AI与物理的交融...

    No.66 智源社区 预训练组 预 训 练 研究 观点 资源 活动 周刊订阅 告诉大家一个好消息,<预训练周刊>已经开启"订阅功能",以后我们会向您自动推送最新版的&l ...

  6. AI:DeepSpeed Chat(一款帮用户训练自己模型的工具且简单/低成本/快 RLHF 训练类ChatGPT高质量大模型)的简介、安装、使用方法之详细攻略

    AI:DeepSpeed Chat(一款帮用户训练自己模型的工具且简单/低成本/快 RLHF 训练类ChatGPT高质量大模型)的简介.安装.使用方法之详细攻略 目录 DeepSpeed Chat的简 ...

  7. AI on Android:安卓平台上的人工智能应用实战(02.模型的再训练)

    AI on Android:安卓平台上的人工智能应用实战(02.模型的再训练) AI on Android:安卓平台上的人工智能应用实战(01.环境的搭建):https://blog.csdn.net ...

  8. [AI医学] 医学领域几个微调预训练大模型的项目

    关键词:AI医学,医学大模型,指令微调,PubMed 文章目录 医学微调大模型 1. MedicalGPT-zh 2. DoctorGLM 3. Huatuo-Llama-Med-Chinese &a ...

  9. 机器学习服务第一梯队都有谁?权威研究机构Forrester发布最新报告

    茕茕 发自 凹非寺 量子位 报道 | 公众号 QbitAI 科技巨头的「云」竞争,如今最核心拼的刀刃就是人工智能. 无论是从不断扩大的云AI市场规模,还是从国内各大云厂商云+AI的标准配置上,都可见一 ...

  10. Meta AI西雅图研究负责人Luke Zettlemoyer|万亿参数后,大模型会持续增长吗?

    导读:预训练语言模型正变得越来越大,在惊讶于其强大能力的同时,人们也不禁要问:语言模型的规模在未来会持续增长吗? Meta AI西雅图研究负责人,华盛顿大学计算机科学与工程学院Paul G. Alle ...

最新文章

  1. 读完这本书,我做了一个APP
  2. Docker 容器技术 — 容器存储
  3. BZOJ4668: 冷战 [并查集 按秩合并]
  4. EnterpriseLibrary2.0系列文章及下载
  5. 计算机目录读取,从项目目录中读取SQL查询文件(Read SQL query file from project directory)...
  6. 数据库事务的隔离级别简单总结
  7. 用jedis访问Redis进行对象存取示例
  8. 乐视手机android流量,乐视手机流量不能用怎么办
  9. 您从未听说过的Java 8的10个功能
  10. windows服务器新建管理员用户_用户和组管理
  11. fread返回值0 feof返回值为16 问题解决。
  12. 清除回收站苦闷纠结欣喜
  13. calculate函数使用方法c语言,使用 CALCULATE 函数
  14. 蝉道Bug管理工具的环境搭建
  15. 大脑信息编码_编码人大脑的5大小吃
  16. 仓储场景使用电子货架电子标签具体有哪些优势?又是如何影响前端零售?
  17. 14.[保护模式]TSS任务段
  18. 研华PCI板卡开发(6)快速入门(6)属性列表
  19. 五个好用的网络协议分析工具
  20. 盖茨和李嘉诚双龙卸甲 他们的区块链业务一个在链圈扶贫 一个在币圈赚钱

热门文章

  1. 【优化算法】蛾群优化算法(MSA)【含Matlab源码 1451期】
  2. 【扩频通信】基于matlab GUI扩频通信系统仿真【含Matlab源码 772期】
  3. 【水果识别】基于matlab GUI灰度+二值化+腐蚀+膨胀算法水果识别【含Matlab源码 671期】
  4. 【车间调度】基于matlab粒子群算法求解生产调度问题【含Matlab源码 412期】
  5. 【TWVRP】基于matlab节约算法求解带时间窗的车辆路径规划问题【含Matlab源码 156期】
  6. c语言设计四路彩灯显示系统,数字电路逻辑设计课程设计-四路彩灯显示系统设计...
  7. 证书重新生成_Kubernates证书过期问题的解决
  8. 算法 博士_Strangecode博士-我如何学会不再担心并喜欢算法
  9. 数据集:102 flower、Cratech256、ImageNet数据集下载
  10. 深度系统文件服务器,深度系统镜像文件