深度学习无法解决的问题，只有强化学习才能解决

从理论上讲，深度学习只不过是一个数学模型并没有任何的智能
和经典物理一样的固定
而智能是量子物理一样的神奇，也就是说一个人调整了自己的位置
同时也改变了自己相对空间的位置

同理反论一个深度学习模型参数固定了，还怎么有相对参数，所以
深度学习不是智能
所以深度学习无法解决所有的问题，

但是人们忽略了，位置的测量方法是不变的，只要我们掌握了测量方法，就不用理解世界的本质，一样可以很好的解决问题
就如同卡车司机一样并不知道卡车内部的结构，只要知道怎么控制
得到什么样的反应即可，也就是说刺激和回馈

就是说深度模型若能完全的表达一个事物，那么通过统计就可以解决任何问题

或者使用强化学习模型
强化学习是一个自我统计后得出结论的交互式学习

强化学习马尔可夫原理

短期回报 + 长期回报

长期回报 = 每个动作的概率 x该状态下执行动作的回报加和

深度学习无法解决的问题，只有强化学习才能解决相关推荐

《强化学习周刊》第29期：Atari 深度强化学习的研究综述、金融强化学习的最新进展...
No.29 智源社区强化学习组强化学习研究观点资源活动关于周刊强化学习作为人工智能领域研究热点之一,其研究进展与成果也引发了众多关注.为帮助研究与工程人员了解该领域的相关进展和 ...
人工智能 java 坦克机器人系列: 强化学习_人工智能 Java 坦克机器人系列: 强化学习 | 学步园...
本文中,我们将使用强化学习来实现一个机器人.使用强化学习能创建一个自适应的战斗机器人.这个机器人能在战斗中根据环境取得最好的策略,并尽力使战斗行为最佳.并在此过程中不断学习以完善自身不足. Roboc ...
人工智能 java 坦克机器人系列: 强化学习_人工智能 Java 坦克机器人系列: 强化学习...
人工智能 Java 坦克机器人系列: 强化学习发表于:2007-05-24来源:作者:点击数: 本文中,我们将使用强化学习来实现一个机器人.使用强化学习能创建一个自适应的战斗机器人.这个机器人能在战 ...
【文献学习】基于动作规划和强化学习的多智能体集群
Minghui Wang, Bi Zeng, Quijie Wang. Research on motion planning based on flocking control and reinfo ...
【强化学习】⚠️手把手带你走进强化学习 2⚠️ OPP 算法实现月球登陆器 (PyTorch 版)
[强化学习]⚠️手把手带你走进强化学习 2⚠️ OPP 算法实现月球登陆器概述强化学习算法种类 PPO 算法 Actor-Critic 算法 Gym LunarLander-v2 启动登陆器 PP ...
强化学习系列（1）：强化学习（Reinforcement Learning）
强化学习前世今生也可以直接查看本博主强化学习专栏的简介: https://blog.csdn.net/gsww404/article/details/79763003 [直接点击查看完整版] 如今机 ...
深度强化学习系列（一）：强化学习概述
交流请加群:580043385 我的知乎专栏同步发布:https://zhuanlan.zhihu.com/p/22542101 转载请标明出处:http://blog.csdn.net/ikerpe ...
【githubshare】深度学习蘑菇书，覆盖了强化学习、马尔可夫决策过程、策略梯度、模仿学习
GitHub 上的深度学习技术书籍:<蘑菇书 EasyRL>,覆盖了强化学习.马尔可夫决策过程.策略梯度.模仿学习等多个知识点. GitHub:github.com/datawhalech ...
让AI学习如何玩游戏 OpenAI打造强化学习通用模型
过度学习是许多AI模型的问题,要开发出通用型AI,就必须解决这道难题,OpenAI近日释出一个特别的训练环境CoinRun,该平台藉由游戏设计,能够提供指针,让程序将过去学习到的经验,转移到全新环境中 ...
多智能体强化学习_基于多智能体强化学习主宰星际争霸游戏
大家好,今天我们来介绍基于多智能体强化学习主宰星际争霸游戏这篇论文 Grandmaster level in StarCraft II using multi-agent reinforcement ...

深度学习无法解决的问题，只有强化学习才能解决

深度学习无法解决的问题，只有强化学习才能解决相关推荐

最新文章

热门文章