点击“开发者技术前线”,选择“星标????”
让一部分开发者看到未来

新智元报道 来源:B站

近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自己吃不到羊,直接选择了「自杀」。然而,狼选择撞石的原因竟是「自杀分数高」!

智障AI狼最近火了!

在一个狼吃羊的AI游戏中,狼发现自己吃不到羊,而选择了「自杀」。

那么,狼为啥会选择直接撞死呢?

傻狼选择「自杀」,只因人间不值得!

近日,微博上一位网友@二雨TR最近发文称,听我老师给我讲他搞游戏ai的事情笑死我了。

在他发布的这三张聊天记录截屏中,具体介绍了这个狼抓羊的游戏机制。

从截图中可以看出,狼选择撞石的原因竟是,「自杀分数高!」

在这个项目中,研究人员给设定了狼吃羊游戏的基本原则是,狼在20秒内得分越高越好,而羊在20秒内存活时间越长得分越高。

开局两只狼,还有六只羊,地图上红色带×的字符就是狼和羊随机出现的可能位置。

狼和羊前面有6根射线,是用来感知范围。当这6根线和障碍物以及地图边界碰撞,就会返回一个坐标。

那根坐标白线便是狼和离它最近羊的连接,这样狼就可以每次优先吃掉最近的那只羊。

在研究人员开始训练的最初阶段,先固定了羊的位置,让狼去学习抓羊。

在狼学会抓羊后,羊也以随机的位置出现在游戏中。

狼抓到羊,奖励10分

狼撞到障碍物,扣1分

为了节省狼抓羊的时间,每秒钟狼都会受到0.1的惩罚

其中,羊撞到石头不会死,只要存活时间长,羊就能得到高分。

如果这两只狼想要在20秒以内得到高分,需要狼吃到羊的数量越多越好,吃羊所用时间越短越好。

在研究人员进行了20W次的训练,竟发现狼抓羊的效果越来越差。

大多数情况下狼基本吃不到羊,而且在抓羊的过程中浪费的时间也被扣分,干脆就选择撞死了!

该项目的一位研究人员@Sdust星尘研表示,「之所以会自杀, 是因为狼在前几万次的训练中发现一头撞死只扣-1.1分(-1 + -0.1)。

往羊那边走两步撞死扣-1.1到-2.4分。

偶尔一次能吃到,虽然正分,但是不值得」。

狼是打工人,羊是永远达不到的升职加薪

这只蠢狼已经在微博、知乎、豆瓣等各大平台上火出了圈。

网友们从狼抓羊的身上看到了自己。

那只狼不就是现在的我么!

狼就是打工人…每秒扣的是青春和时间,羊是永远达不到的「升职、加薪、迎娶白富美、走上人生巅峰」,撞石头就是躺平摸鱼…

还有网友表示,「AI训练告诉你,为什么现在的年轻人都不愿意努力了」。

奖励机制不合理

有网友对这一项目的奖励机制设置是否合理提出了质疑。

还有网友认为,单步惩罚太大,而撞障碍物的惩罚太小,应该把奖励函数设置为,撞到障碍物的惩罚无穷大,那么狼就知道了撞石的代价,就不会轻易选择自杀了。

所以,狼选择自杀的部分原因也是奖励机制设置不合理而导致的。

星尘研在B站中的视频表示,狼自杀的错误是很多因素共同影响产生的,最主要的原因是迭代次数太少,20W次完全不够学。后面提高到100W次起步,效果直线上升。

自暴自弃的狼终于抓到了羊

训练次数从最初5W次一轮,迭代了13代。到后来改成200W一轮,迭代了5代,狼抓羊的训练效果明显提升。

在训练了300万次后,狼终于可以成功地吃到羊。

但是,游戏还是存在一定的缺陷,两只狼还是会偶尔撞石而死。

狼终于学会了抓羊~~

参考资料:

https://m.weibo.cn/6611961566/4613651452134398 https://m.weibo.cn/6611961566/4613930355525879

https://www.bilibili.com/video/BV16X4y1V7Yu?p=1

END


最近写了一套 6000 页的 Java 学习手册,以及珍藏四本 Java 人必读4大神器,分享到知乎已经 3 万赞了!
整个资料包内容专注 Java技术,包括 Spring、Spring Boot/Cloud、Dubbo、JVM、集合、多线程、JPA、MyBatis、MySQL、大数据、Nginx、Git、Docker、GitHub、Servlet、JavaWeb、IDEA、Redis、算法、面试题等相关内容。图文并茂,附有源码,还送一波电子书。内容包括但不限于:
每篇文章图文并茂,附有源码。还有电子书合集如果你想获得完整PDF可以通过以下方式获得

扫码加我微信进群,内推和技术交流,大佬们零距离

历史推荐

快手大数据平台服务化实践

为什么我劝你放弃了Restful API?

拿到腾讯字节快手Offer后,这位大佬在Github上的LeetCode刷题经验已开源!

微信13亿日活下,微信支付 Elasticsearch 调优实践

2021 必须掌握的 21 个 Java 核心技术


http://www.taodudu.cc/news/show-5580325.html

相关文章:

  • 1.20e|HUM新开局及对抗各种族后续战术
  • CAD进度条设置3种方法
  • 一些实用的工具分享
  • Python tkinter 如何实现网站下载工具?将所有数据一键获取
  • 浅谈计算机视觉HALCON视觉库识别车牌号
  • android localPlayer
  • RTSP协议简介
  • android多媒体框架之流媒体----base on jellybean(八)
  • 流媒体协议RTSP,HTTP,HTTPS, SDP
  • RTSP Spec中文版(12-16)
  • 流媒体协议RTSP、HTTP、HTTPS、SDP四种区别解析
  • RTSP、HTTP、HTTPS、SDP四种协议详解
  • 类 文件 右下角呈现 红色小圆圈,里面有一个J 标记
  • 矩阵运算中一个圆圈中间一个乘号的运算是什么
  • html圆圈中间一个感叹号实现,一个感叹号一个圆圈的故障灯,汽车叹号故障灯图解...
  • 电脑桌面快捷方式左下角有个蓝色圆圈,里面一个问号是怎么回事?可正常打开...
  • 微信小程序 转发给用户
  • uniapp(HBuilder X)实现微信小程序转发好友和分享朋友圈(携带多个参数)
  • 微信小程序转发微信小程序转发
  • 微信小程序转发动态消息的问题
  • 微信小程序 转发、分享、收藏、复制链接
  • 微信小程序 转发
  • Excel表格让某一行/列总是停留在显示页面内的方法(冻结窗格)
  • 如何让excel冻结窗格在打印的每页出现
  • 打印机加墨方法
  • 游戏建模实战教程:《黎明杀机》中的鬼武士,Maya和ZBrush制作全流程
  • XMind 8安装与破解
  • XMind8破解说明(亲测有效)
  • 【转】2007年度最有趣味的网站大全
  • 2007年度最有趣味的BT网站大全

这个拒绝内卷的狼火了!高智商却自暴自弃,不想抓羊只想躺相关推荐

  1. 本周AI热点回顾:「时空版」Transformer训练速度远超3D CNN;拒绝内卷的AI狼火了!不想抓羊只想躺!...

    ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍点击左上方蓝字关注我们 01 「时空版」Transformer训练速度远超3D CNN,提速3倍! Facebook AI推出了全新的视频理解架构TimeSform ...

  2. 这个拒绝内卷的AI狼火了!高智商却自暴自弃,不想抓羊只想躺

      新智元报道   来源:B站等 编辑:Yaxin [新智元导读]近日,一个狼吃羊的AI火了!在一个狼吃羊的AI智障游戏中,狼发现自己吃不到羊,直接选择了「自杀」.然而,狼选择撞石的原因竟是「自杀分数 ...

  3. 【拒绝内卷】狼吃羊的AI奖励机制不合理: 内卷,如何解决?

    深度强化学习实验室 官网:http://www.neurondance.com/ 论坛:http://deeprl.neurondance.com/ 本文转载自:Ai科技评论 作者 | 耳洞打三金 大 ...

  4. 对抗内卷,搞测绘地信的你需要这些插件和小工具来躺平

    搞测绘地信的"打工人"你是否因为"内卷"而栖宿"躺平"?对抗"内卷",想"躺平"的你需要这些插件和小 ...

  5. 拒绝“内卷”跃迁软件测试最大门槛,我是如何从月薪8K到15K的?

    前言 最近有小伙伴私信问我,软件测试这个行业现在太卷啦!根本就找不到工作,我投递了一周上百份简历,回我的不到十个,面试邀约就俩,还没过,我要去送外卖了! 诚然,近一两年,由于现在环境不景气,加上软件测 ...

  6. 【⛔拒绝内卷,学会shell,走遍天下都不怕⛔】shell编程基础

    shell编程基础 shell简介 属性 shell是一个命令行解释器,建立了用户和操作系统之间的接口.当我们在命令行输入一个命令后,shell会对命令进行解释,调用相应的程序去执行.shell是一种 ...

  7. 超硬核,拒绝内卷全靠阿里大能整理的这份 Java 核心手册,堪称强无敌,谁来不说一声牛 AC

    2022 年注定是不寻常的一年,在今年因为疫情以及各大大厂纷纷传来裁员的消息,引得整个互联网圈动荡不堪.腾讯裁员 30%.京东.百度.字节等大厂都在纷纷裁员,引的这些中厂和小厂也跟风裁员. 这个时候外 ...

  8. 高校里的“内卷”能有多少种操作?

    一个神经元能够催生多少故事?香港中文大学信息工程系助理教授周博磊近日撰文介绍了他自 2015 年开始至今对神经元的研究经历.最近,他与 David Bau.朱俊彦等人合作的神经元研究论文发表在了 PN ...

  9. 内卷、躺平与中年危机的相关思考

    内卷.躺平与中年危机的相关思考 要躺平还是内卷 小心"温水煮青蛙" 需要担心30/35岁中年危机吗 我的学习建议 最近裸辞离职,赶上疫情再次爆发,经历了不太愉快的找工作过程,有一点 ...

最新文章

  1. 模板路径,模板变量,过滤器和静态文件的引用
  2. JVM - ZGC初探
  3. 关于分布式事务、两阶段提交协议、三阶提交协议
  4. [architecture]-spin_unlock中是怎样让cpu退出standby模式的?
  5. unity安装,sdk,jdk问题
  6. Java EE 8发生了什么? (第2部分)
  7. bootstrap 垂直居中 布局_CSS3 flex 布局必须要掌握的知识点
  8. mysql安装设置mysql字符集utf8及修改密码
  9. 形态学上的图像顶帽运算和黑帽运算是什么?
  10. es的doc_value对排序字段的作用
  11. 用java实现邮件发送验证码
  12. 详解CATransformLayer
  13. 【天光学术】体育论文:乒乓球少年运动员专项身体素质训练探究(节选)
  14. SCADA系统资料整理-概论
  15. linux查找模糊文件位置,linux模糊查找文件用什么命令比较好
  16. 响应式Web程序设计【15】
  17. 【机器学习算法】神经网络和深度学习-4 重要的BP网络使用总结,了解BP神经网络的魅力
  18. Web全栈~06.CSS选择器
  19. @用Python的turtle库画一个奥运五环!
  20. ASP.NET MVC 音乐商店 - 8. 使用 Ajax 更新的购物车

热门文章

  1. VoLTE语音编码标准,NV控制
  2. 数值分析c语言pdf,数值分析C语言代码教学提纲.pdf
  3. 为什么少有人使用RESTful API?
  4. 随着计算机的发展英语,随着的发展是什么意思
  5. [贝聊科技] iOS 终极横竖屏切换解决方案
  6. 大数据Kettle实时同步数据的六种方案
  7. 如何理解dirichlet distribution
  8. mysql 多表联查_MySQL的多表联查
  9. java 实现微博推送_编写调用新浪微博API的Java程序来发送微博
  10. 有节操的设计多参数方法