(文末有福利哦)

我叫实小楼

万万没想到

我被困在迷宫里走不出来了……

看到图中身处迷宫入口

一脸懵逼的小狮子没?

那就是我

今天老板把我扔在了这儿

说是要惩罚我

“走不出迷宫,

实验楼就准备换吉祥物了!”

好吧,我承认

前几天我确实膨胀了:

在实验楼吃喝玩乐

干扰同事工作

没尽好吉祥物的本分

可我还是个孩子啊

太无情了

而且为毛会是走迷宫这种奇葩惩罚

我 tm 可真是太难了

“你可别墨迹了

小脑斧? 梅发怒? 小海疼?

已经来我这报名了

还想不想干了”

迷宫入口挂的喇叭高声嚷着

惹不起惹不起

强装镇定的

我一只爪子迈进了入口

???

这里为啥都一毛一样

一点参照物都没有

???

等等

这个路口我好像来过···

???

完了 已经迷路了 咋整……

还是用绝招吧:

“点兵点将、骑马打仗

点到是谁,跟到我走

要是不走,你是小狗……”

就这样,我点了十轮

可还是在原地打转

—— 绝望了

就在迷宫里躺尸算了

我叫实小楼

万万没想到

我最终还是从迷宫里走了出来

正当我绝望的时候

从天而降了一个小玩意儿

我拾掇起来一看

“迷宫辅助装置”

这玩意儿咋用也不知道

先走一截试试

眼前还是有无数路口

随便选一个吧

刚要走,辅助装置出声了

“这里是一条死路”

就听它的吧

退了回来,换一个路口走

之后我便一直听它的提示

遇到死路时

就及时换一条道

终于……

我走到了出口

也听到辅助器说:

“这是一条正确道路”

看来

吉祥物的名分

算是保住了 ···

回到实验楼我才知道

原来让我走迷宫

不只是为了惩罚我

更是为了测试新产品

没错,就是救我一命的辅助装置就是——

强化学习!

强化学习是机器学习的重要分支

它强调如何基于环境而行动

以取得最大化的预期利益

强化学习的过程一般包含 5 个要素

分别是

智能体(Agent)

环境(Environment)

行为(Action)

状态(State)

奖励(Reward)

以走迷宫为例:

小狮子就是智能体(Agent)

而迷宫就是所处的环境(Environment)

当小狮子尝试走出迷宫时

小狮子在每一个格子

都可以产生 4 种行为

向上向下向左向右

每当做一种行为时

迷宫都会给小狮子一个奖励

奖励可能是正向的

也可能是消极的

那什么是状态呢

每当小狮子采取行动后

随即进入到下一个状态

状态类似于对前面历史行为的总结

接下来

小狮子就会在迷宫中不断试错

最终到达出口

到达出口时也是正奖励之和最大的时候

我再给你们看看它的内部构造

恕我直言

这带我出迷宫的知识

我一定要好好学习一下

另外

为了报答它的救命之恩

我准备送它上 C 位

我舍弃了零花钱

炸锅卖铁

换了几十张 30 元优惠券

欢迎大家在评论区领取哦

更多课程详情,请登陆实验楼:

课程链接https://www.shiyanlou.com/courses/1366

我是实小楼,万万没想到,强化学习帮我走出了迷宫相关推荐

  1. python绘制3d图形-万万没想到,Python 竟能绘制出如此酷炫的三维图

    作者 | Jay Alammar 译者 | 高级农民工 通常我们用 Python 绘制的都是二维平面图,但有时也需要绘制三维场景图,比如像下面这样的: 这些图怎么做出来呢?今天就来分享下如何一步步绘制 ...

  2. python画三维立体图难吗_万万没想到,Python竟能绘制出如此酷炫的三维图

    作者 | Jay Alammar转载自 | 高级农民工 通常我们用 Python 绘制的都是二维平面图,但有时也需要绘制三维场景图,比如像下面这样的: 这些图怎么做出来呢?今天就来分享下如何一步步绘制 ...

  3. 万万没想到,我的炼丹炉玩坏了

    一只小狐狸带你解锁NLP/ML/DL秘籍 作者:夕小瑶 前记 众所周知,夕小瑶是个做NLP的小可爱. 虽然懂点DL框架层知识,懂点CUDA和底层,但是我是做算法的哎,平时debug很少会遇到深度学习框 ...

  4. 2015年第21本:万万没想到,用理工科思维理解世界

    <万万没想到:用理工科思维理解世界>这本书好像是从amazon排行榜中发现的,先是下载了电子版,竟然是一个博客(学而时嘻之)的大合集,可能是网上的某人用作者的博客制作而成的,共有123章! ...

  5. 【杂谈】万万没想到,有三还有个保密的‘朋友圈’,那里面都在弄啥!

    万万没想到,有一天我们也会标题党,透过标题看本质,今天说的确实是那么回事儿也. 一直以来我们都有一个不公开的私密社区叫有三AI知识星球,但是经常遇到一些朋友,甚至是加入季划的同学都在问我,那是个啥?看 ...

  6. 【读书笔记】理工科思维解读《万万没想到》

    目录 一.逻辑脉络(框架) Part One 反常识思维 1 Part Two 成功学的解药 65 Part Three 霍金的答案 199 二.亮点 [亮点摘抄]-- 主要可查看"逻辑脉络 ...

  7. 万万没想到系列,世界上最知名的失败建筑设计合集!

    ​ 大家好,这里是建模助手. 我们生活在由建筑包围的世界里,生活的面貌造就了建筑的多样性.而矗立的建筑也无言的记录着时代,尤其是一些建筑大师们的作品,可谓是集艺术和美学于一体的一流名作. 但,这不是凡 ...

  8. 科学家们竟用乐高观察细胞,网友:万万没想到啊

    杨净 子豪 发自 凹非寺 量子位 报道 | 公众号 QbitAI 玩乐高还能玩出个显微镜?! 原本以为是一个普普通通的玩具. 没想到,还真能当成显微镜来用,是能看到细胞的那种. 真·高端新玩法! 比如 ...

  9. 字节跳动---万万没想到之聪明的编辑

    字节跳动-万万没想到之聪明的编辑 文章目录 字节跳动---万万没想到之聪明的编辑 一.题目描述 二.分析 三.代码 一.题目描述 我叫王大锤,是一家出版社的编辑.我负责校对投稿来的英文稿件,这份工作非 ...

最新文章

  1. [k8s] 第六章 Pod控制器详解(Controller-manager)
  2. mysql union all 别名_MySQL Union合并查询数据及表别名、字段别名用法分析
  3. python在线课程-《Python程序设计与应用》在线课程使用说明
  4. RHCSA笔记整理(1)
  5. org.hibernate.HibernateException: connnection proxy not usable after transaction
  6. Springcloud中的region和zone的使用
  7. Oracle数据库更新时间的SQL语句
  8. 没有修改出现mysql密码错误_MySql 修改密码后的错误快速解决方法
  9. aspose-cad dwg转pdf dwg转png dwg转svg
  10. 1G、2G、3G、4G和5G有什么区别?5G的原理是什么?
  11. DOS命令篇(find 和 findstr)
  12. This primary key of id is primitive 不建议如此请使用包装类 in Class
  13. 电源环路增益测试的原理与仿真(基于buck变换器和PID控制)
  14. android动态壁纸1——初步框架(有背景,能使用,仿可爱宝贝)
  15. ChatGPT专业应用:生成外贸询盘邮件
  16. GitLab CI 构建过程中映射Kubernetes上的MySQL端口
  17. bat批处理 if 命令示例详解
  18. word单倍行距,行距不同
  19. java 使用nullable_java – @NonNull和@Nullable的正确用法是什么?
  20. 玩王者荣耀之后反思自己

热门文章

  1. vue创建的挂钩中出错_建立自己的Vue 3 SWR挂钩
  2. gitlab:切换远程仓库
  3. CloudFlare Workers 设置使用自定义域名
  4. 信息安全工程师学习笔记《第三章》
  5. Python——组合数据类型的应用_1.英文句子中的词频统计
  6. 支付宝转账到个人账户
  7. 学号20182325袁源 实验一《Linux基础与Java开发环境》实验报告
  8. java currency 默认_Java Currency getCurrencyCode()方法与示例
  9. 中国制造2025与工业以太网
  10. 我跳过的坑-解决linux的输入法问题。