你玩《2048》能拿多少分?AI的最高分纪录:401912
来源|量子位
如果让AI来玩《2048》这样的游戏,那会是怎样一种画面?
现在,有人用强化学习方法实践了起来。
于是,插上DQN的翅膀,AI从零起步,自己琢磨出了《2048》的玩法:
一起手,是不是就有内味了?
这操作,条理清晰到令人感到舒适。“1000,no;1024,yes”的强迫症们不禁纷纷点赞,给这只AI贡献了800+ reddit热度。
用DQN玩《2048》
调教出这只会玩《2048》的AI的,是一位巴西老哥Felipe Marcelino。目前正在米纳斯吉拉斯联邦大学攻读CS硕士。
首先,他采用OpenAI Gym构建了自定义强化学习环境。
其中包括两种2048棋盘表示方式:
二进制——使用二次幂矩阵表示棋盘中的每一块区域
非二进制——原始数字矩阵
模型包含两种类型的神经网络:CNN和MLP(多层感知机)。
据Felipe介绍,与MLP相比,以CNN作为特征提取器的智能体表现得更好。
训完之后,老哥测试了一下,在1000把游戏中,AI有100次达到了2048。
玩《2048》的AI们
目前,这只用DQN训练出的AI玩到2048就打住了。
不过,巴西老哥抛砖,又吸引了不少来献玉的盆友。
比如,同样采用强化学习方法,将时序差分学习和最大期望搜索相结合的2048控制器。
在10步/秒的策略下,它最高能凑出32768。
而在追求高分的路上,有一位来自日本的选手表现亮眼。
依靠7个卷积层的深度卷积网络,这只在《2048》这个游戏中最高拿到了401912分。
正如一位网友所说:这正是一个足够有趣,又不太复杂的强化学习案例。
如果你是刚刚开始学习强化学习,也不妨拿这个小项目练练手~
参考链接
《2048》相关开源项目:
https://github.com/FelipeMarcelino/2048-gym
https://github.com/aszczepanski/2048
https://github.com/thomasahle/mcts-2048/
相关论文:
https://www.jstage.jst.go.jp/article/ipsjjip/27/0/27_340/_pdf
http://arxiv.org/abs/1604.05085
觉得有用麻烦给个在看啦~
你玩《2048》能拿多少分?AI的最高分纪录:401912相关推荐
- 我的名片能运行Linux和Python,还能玩2048小游戏,成本只要20元
晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 猜猜它是什么?印着姓名.职位和邮箱,看起来是个名片.可是右下角有芯片,看起来又像是个PCB电路板. 其实它是一台超迷你的ARM计算机,不仅 ...
- python神经网络训练玩游戏_python – 如何训练神经网络来玩2048游戏?
我想训练神经网络玩2048游戏.我知道NN对于像2048这样的状态游戏来说不是一个好选择,但是我想要实现NN将像经验丰富的人类一样玩游戏,即仅在三个方向上移动游戏. 但由于我们不知道有效输出,我无法弄 ...
- win8 android 跑分,Win8.1也能玩安兔兔跑分?蓝魔i10pro更多谍照
Win8.1也能玩安兔兔跑分?蓝魔i10pro更多谍照 3月20日,蓝魔将在北京竞园艺术中心举行蓝魔新一代英特尔芯平板发布会,届时将会有多款采用英特尔芯的平板力作面世.在临近大会到来之际,在网上传得火 ...
- 4分钟训练ImageNet!腾讯机智创造AI训练世界纪录
4分钟训练ImageNet! 腾讯机智创造AI训练世界纪录 by 腾讯机智团队 注:腾讯机智机器学习平台由TEG架构平台部和运营管理部团队携手,并和香港浸会大学计算机科学系褚晓文教授团队深度合作联袂打 ...
- 5位评委对参赛选手进行打分,将所有的打分结果存储到对应类型的数组中, 将所有的评分结果去除一个最低分,去除一个最高分,然后获取的平均分数为 选手的最终得分.设计程序,用键盘输入5位评委的评分,并打印输
5位评委对参赛选手进行打分,将所有的打分结果存储到对应类型的数组中, 将所有的评分结果去除一个最低分,去除一个最高分,然后获取的平均分数为 选手的最终得分.设计程序,用键盘输入5位评委的评分,并打印输 ...
- AI 玩王者荣耀狂上分!打了六局,心态崩了
你造吗?人工智能继进军围棋之后,又来我"王者峡谷"了. 腾讯AI LAB与王者荣耀合作开发的AI[绝悟],在最高规格赛事中获胜,宣布已达到"电竞职业水平"!据称 ...
- AI 玩王者荣耀狂上分!1 天训练强度达人类 440 年,网友:已卸载
你造吗?人工智能继进军围棋之后,又来我"王者峡谷"了. 腾讯AI LAB与王者荣耀合作开发的AI[绝悟],在近期的最高规格赛事中获胜,宣布已达到"电竞职业水平" ...
- Android7玩游戏卡,玩游戏卡顿上分难?这几款高性能手机适合你
[PConline 导购]随着科技的发展,人们生活习惯也发生变化,现如今年轻人的休闲娱乐方式越来越多样,比如手游就逐渐成为了一种全新的休闲娱乐方式.而对于经常玩手游的年轻人来说,上分吃鸡已经成为他们日 ...
- 你玩的音游可能真是AI生成的,Love Live!工作室发了篇论文,用AI节省50%作谱时间...
萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 现在,你打的音游曲谱,还真有可能是AI生成的! 像下面这些根据节拍生成音符的操作,也就是谱面 (chart),现在AI也能搞出来了: 这是发生在著 ...
最新文章
- Blender3.0电影级别CG场景制作视频教程
- [JMX一步步来] 1、JMX的Hello World
- ICRA2022 | OPV2V: 首个大型自动驾驶协同感知数据集+代码框架已开源
- python动态创建类_Python中通过参数动态创建扩展类(class)
- dapper 注意事项之GUID
- 面向新闻媒体的命名实体识别技术
- hbuild 编译 php,Hbuilder的PHP环境搭建
- vv7无法启动显示发动机故障_发动机电控系统常见故障(发动机不能启动)的解决方法...
- 中国数控攻牙机市场趋势报告、技术动态创新及市场预测
- 【免费毕设】IT产品网上物流管理信息系统的设计与实现(源代码+lunwen)
- NetworkManagementService 解读
- 【力学】基于matlab立铣刀力模拟仿真【含Matlab源码 193期】
- 最新版chrome安装adblock插件
- 手游excel数据分析
- 描写计算机老师上课的神态,描写老师上课的神态的作文300字
- syswow64删除文件_syswow64,教您syswow64是什么文件夹
- 汉字 字库压缩ttf
- python将图片拼接为视频
- 阿里云oss 收费标准细则,太鸡贼了,不要傻傻的以为只收你存储的钱
- 中国56个民族sql语句