梯度下降和随机梯度下降

On Broken Incentives and Deadlock.

关于激励机制和僵局。

By Shawn Jain and Blake Elias[Shawn Jain is an AI Resident at Microsoft Research.Blake Elias is a Researcher at the New England Complex Systems Institute.]

Shawn Jain和Blake Elias着[ Shawn Jain 微软研究中心的 一个 AI驻地 布莱克·埃里亚斯 ( Blake Elias) 新英格兰复杂系统研究所的研究员。 ]

起源 (Origins)

Several years ago, Blake read “Good Strategy / Bad Strategy: The Difference and Why It Matters”, a book on business and management strategy. Chapter 8, “Chain-Link Systems”, describes situations in which a system’s performance is limited by its weakest sub-unit, or “link”:

几年前,布雷克(Blake)读了一本关于业务和管理策略的书“好的策略/坏的策略:差异及其重要性” 。 第8章,“链式链接系统”,描述了系统性能受其最弱的子单元或“链接”限制的情况:

There are portions of organizations, and even of economies, that are chain-linked. When each link is managed somewhat separately, the system can get stuck in a low-effectiveness state. That is, if you are in charge of one link of the chain, there is no point in investing resources in making your link better if other link managers are not.

组织的各个部分,甚至是经济体,都有部分是连锁的。 当对每个链接进行一些单独的管理时,系统可能会陷入低效状态。 也就是说,如果您负责链中的一个链接,那么如果没有其他链接管理器,则没有必要投入资源来使您的链接更好。

To make matters even more difficult, striving for higher quality in just one of the linked units may make matters worse! Higher quality in a unit requires investments in better resources and more expensive inputs, including people. Since these efforts to improve just one linked unit will not improve the overall performance of the chain-linked system, the system’s overall profit actually declines. Thus, the incentive to improve each unit is dulled. [1]

为了使事情变得更加困难,仅在其中一个链接的单元中争取更高的质量可能会使情况变得更糟! 一个单元的更高质量要求对包括人力在内的更好的资源和更昂贵的投入进行投资。 由于仅改善一个链接单元的这些努力不会改善链式链接系统的整体性能,因此该系统的整体利润实际上下降了。 因此,改善每个单元的动力减弱了。 [1]

We wondered, how can this idea be made computational? If an organization were run by one or more AI agents, would it be capable of getting past these limitations?

我们想知道,如何将这个想法变成可计算的? 如果一个组织由一个或多个AI代理运行,它是否能够克服这些限制?

Our intuition is that computation and AI should be able to solve problems where fragmented human organizations get stuck. On the other hand, today’s AI is quite brittle. One failure mode is the existence of local optima.

我们的直觉是,计算和AI应该能够解决零散的人类组织陷入困境的问题。 另一方面,今天的AI相当脆弱。 一种故障模式是局部最优。

It fails to generalize outside its training distribution, and does not form logical representations.

它无法在训练分布范围之外进行概括 ,也没有形成逻辑表示。

问题设定 (Problem Setup)

For a concrete example, consider an assembly line composed of two stations, A and B. Station A takes raw materials and produces a half-finished widget, at a cost of $

梯度下降和随机梯度下降_梯度下降和链链接系统相关推荐

  1. 全梯度下降算法、随机梯度下降算法、小批量梯度下降算法、随机平均梯度下降算法、梯度下降算法总结

    一.常见梯度下降算法 全梯度下降算法(Full gradient descent,FGD) 随机梯度下降算法(Stochastic gradient descent,SGD) 随机平均梯度下降算法(S ...

  2. python随机抽取人名_用Python打造一个CRM系统(五)

    在上一篇上实现了线索功能模块,在实际使用中除了线索数据除了输入的结构化数据,也有可能是来自非结构化数据,如名片.PDF文档.语音视频等.为方便线索录入,本篇中将以名片为例,实现利用OCR等技术将名片信 ...

  3. 梯度下降算法的正确步骤_梯度下降算法

    梯度下降算法的正确步骤 Title: What is the Gradient Descent Algorithm and its working. 标题:什么是梯度下降算法及其工作原理. Gradi ...

  4. 批梯度下降 随机梯度下降_梯度下降及其变体快速指南

    批梯度下降 随机梯度下降 In this article, I am going to discuss the Gradient Descent algorithm. The next article ...

  5. 梯度下降算法_批梯度下降法,Minibatch梯度下降法和随机梯度下降法之间的区别...

    什么是梯度下降法? 梯度下降法是一种机器学习中常用的优化算法,用来找到一个函数(f)的参数(系数)的值,使成本函数(cost)最小. 当参数不能解析计算时(如使用线性代数),并且必须通过优化算法搜索时 ...

  6. 深度学习(23)随机梯度下降一: 随机梯度下降简介

    深度学习(23)随机梯度下降一: 随机梯度下降简介 1. What's Gradient? 2. What does it mean? 3. How to search? 4. For instanc ...

  7. 梯度下降法_梯度下降

    梯度下降法 介绍 (Introduction) Gradient Descent is a first order iterative optimization algorithm where opt ...

  8. pytorch学习笔记(三十三):梯度下降和随机梯度下降

    文章目录 前言 1. 一维梯度下降 2. 学习率 3. 多维梯度下降 4. 随机梯度下降 小结 前言 在本节中,我们将介绍梯度下降(gradient descent)的工作原理.虽然梯度下降在深度学习 ...

  9. 最优化方法:梯度下降(批梯度下降和随机梯度下降)

    http://blog.csdn.net/pipisorry/article/details/23692455 梯度下降法(Gradient Descent) 梯度下降法是一个一阶最优化算法,通常也称 ...

最新文章

  1. 关于flink的日志文件设置
  2. 【EventBus】事件通信框架 ( 实现几个关键的封装类 | 消息中心 | 订阅注解 | 订阅方法封装 | 订阅对象-方法封装 | 线程模式 )
  3. Oracle-锁解读
  4. mysql导出txt到client_mysql导出导入txt以及sftp自动下载(一)
  5. 【两种解法】基础实验4-2.2 列出叶结点 (25 分)
  6. 离散数学图论旅行规划问题_《图论及其应用》(一)
  7. solr后台登录验证
  8. Windows Hook机制(转贴一)
  9. 为什么我们创业失败了和选择创业公司的思考
  10. 使用FlashPaper在线转换.doc为.swf
  11. php 爬虫登录网站,Python爬虫模拟登录带验证码网站
  12. 通过动态NAT实现内网访问外网,通过静态NAT实现外网访问内网的WEB服务器
  13. Eureka学习过程
  14. fiddler抓APP的htpps請求,全部都是Tunnel to ......CONNECT...443的解决办法
  15. 使用C#实现DHT磁力搜索的BT种子后端管理程序+数据库设计(开源)
  16. C语言中不同类型的运算和比较问题
  17. 5G NR学习理解系列——时频结构及相关概念
  18. 数字电路设计之Leon系列处理器结构
  19. 与iOS的初吻---方法命名与调用
  20. Java Double类型精确运算解决

热门文章

  1. java读取resouces目录下文件
  2. 【转】Dubbo_与Zookeeper、SpringMVC整合和使用(负载均衡、容错)
  3. /dev/zero和/dev/null的区别
  4. 基于MUI框架的HTML5+的二维码扫描实现
  5. mellanox 网卡驱动_收购Mellanox之后 NVIDIA发布全球首款25G安全智能网卡
  6. zigbee协议_智能家居的ZigBee到底是什么?和Wi-Fi有何区别?
  7. SSH putty Disconnected: Server protocol violation: unexpected SSH2_MSG_UNIMPLEMENTED packet
  8. php根据指定字段去重,php二维数组根据某个字段去重
  9. AB-string CodeForces - 1238D(思维)
  10. 解决jupyter notebook的kernel error内核启动失败问题