从理论上讲,深度学习只不过是一个数学模型并没有任何的智能
和经典物理一样的固定
而智能是量子物理一样的神奇,也就是说一个人调整了自己的位置
同时也改变了自己相对空间的位置

同理反论 一个深度学习模型参数固定了,还怎么有相对参数,所以
深度学习不是智能
所以深度学习无法解决所有的问题,

但是人们忽略了,位置的测量方法是不变的,只要我们掌握了测量方法,就不用理解世界的本质,一样可以很好的解决问题
就如同卡车司机一样并不知道卡车内部的结构,只要知道怎么控制
得到什么样的反应即可,也就是说刺激和回馈

就是说深度模型若能完全的表达一个事物,那么通过统计就可以解决任何问题

或者使用强化学习模型
强化学习是一个自我统计后得出结论的交互式学习

强化学习 马尔可夫原理

短期回报 + 长期回报

长期回报 = 每个动作的概率 x该状态下执行动作的回报加和

深度学习无法解决的问题,只有强化学习才能解决相关推荐

  1. 《强化学习周刊》第29期:Atari 深度强化学习的研究综述、金融强化学习的最新进展...

    No.29 智源社区 强化学习组 强 化 学  习 研究 观点 资源 活动 关于周刊 强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...

  2. 人工智能 java 坦克机器人系列: 强化学习_人工智能 Java 坦克机器人系列: 强化学习 | 学步园...

    本文中,我们将使用强化学习来实现一个机器人.使用强化学习能创建一个自适应的战斗机器人.这个机器人能在战斗中根据环境取得最好的策略,并尽力使战斗行为最佳.并在此过程中不断学习以完善自身不足. Roboc ...

  3. 人工智能 java 坦克机器人系列: 强化学习_人工智能 Java 坦克机器人系列: 强化学习...

    人工智能 Java 坦克机器人系列: 强化学习 发表于:2007-05-24来源:作者:点击数: 本文中,我们将使用强化学习来实现一个机器人.使用强化学习能创建一个自适应的战斗机器人.这个机器人能在战 ...

  4. 【文献学习】基于动作规划和强化学习的多智能体集群

    Minghui Wang, Bi Zeng, Quijie Wang. Research on motion planning based on flocking control and reinfo ...

  5. 【强化学习】⚠️手把手带你走进强化学习 2⚠️ OPP 算法实现月球登陆器 (PyTorch 版)

    [强化学习]⚠️手把手带你走进强化学习 2⚠️ OPP 算法实现月球登陆器 概述 强化学习算法种类 PPO 算法 Actor-Critic 算法 Gym LunarLander-v2 启动登陆器 PP ...

  6. 强化学习系列(1):强化学习(Reinforcement Learning)

    强化学习前世今生 也可以直接查看本博主强化学习专栏的简介: https://blog.csdn.net/gsww404/article/details/79763003 [直接点击查看完整版] 如今机 ...

  7. 深度强化学习系列(一):强化学习概述

    交流请加群:580043385 我的知乎专栏同步发布:https://zhuanlan.zhihu.com/p/22542101 转载请标明出处:http://blog.csdn.net/ikerpe ...

  8. 【githubshare】深度学习蘑菇书,覆盖了强化学习、马尔可夫决策过程、策略梯度、模仿学习

    GitHub 上的深度学习技术书籍:<蘑菇书 EasyRL>,覆盖了强化学习.马尔可夫决策过程.策略梯度.模仿学习等多个知识点. GitHub:github.com/datawhalech ...

  9. 让AI学习如何玩游戏 OpenAI打造强化学习通用模型

    过度学习是许多AI模型的问题,要开发出通用型AI,就必须解决这道难题,OpenAI近日释出一个特别的训练环境CoinRun,该平台藉由游戏设计,能够提供指针,让程序将过去学习到的经验,转移到全新环境中 ...

  10. 多智能体强化学习_基于多智能体强化学习主宰星际争霸游戏

    大家好,今天我们来介绍基于多智能体强化学习主宰星际争霸游戏这篇论文 Grandmaster level in StarCraft II using multi-agent reinforcement ...

最新文章

  1. routeros v6.43.2_routeros软路由负载均衡,充分利用带宽,提高效率降低成本
  2. Java客户端访问HBase集群解决方案(优化)
  3. weka: exhaustive search
  4. Kali Linux 下渗透测试 | 3389 批量爆破神器 | hydra | 内网渗透测试
  5. java web 断点上传_使用WebUploader实现分片断点上传文件功能(二)
  6. java基础:13.1 集合框架 - ArrayList
  7. easyui框架中关于dialog自带关闭事件的使用
  8. 微信公众平台开发接口返回码说明
  9. 转载:基于大数据的互联网金融反洗钱模型初探
  10. JVM垃圾收集算法及垃圾收集器
  11. 第二章:HLK-7621开发板介绍
  12. 微信小程序实现tab切换(可滑动切换)
  13. 02、PMI点互信息 PPMI(Positive PMI)
  14. win10更新不支持uefi固件的磁盘布局
  15. 黑客的成长(学会使用武器)
  16. 饥荒联机版-Centos7-阿里云服务器-搭建
  17. IntelliJ IDEA—SVN的配置及使用
  18. 西门子ET200SP基座单元的区别与分类以及注意事项
  19. 数字化转型思考的延伸问题
  20. css 边框 不连续,css 不规则边框怎么设置

热门文章

  1. linux目录默认权限是什么,linux文件目录默认权限(详解)
  2. flask_restplus的fields中怎么定义字典_Quora | 成功的定义是什么?
  3. 【 Vivado 】时钟组(Clock Groups)
  4. JavaScript碎片—函数闭包(模拟面向对象)
  5. PIE SDK热力图
  6. java面试-深入理解JVM(一)——JVM内存模型
  7. IIS与ASP.NET对请求的处理
  8. servlet/filter/listener/interceptor区别与联系
  9. Ceph Upstream 添加 InfiniBand RDMA 互联支持
  10. 最新版,别的可以不用看了,zabbix 监控 esxi