来源|量子位

如果让AI来玩《2048》这样的游戏,那会是怎样一种画面?

现在,有人用强化学习方法实践了起来。

于是,插上DQN的翅膀,AI从零起步,自己琢磨出了《2048》的玩法:

一起手,是不是就有内味了?

这操作,条理清晰到令人感到舒适。“1000,no;1024,yes”的强迫症们不禁纷纷点赞,给这只AI贡献了800+ reddit热度。

用DQN玩《2048》

调教出这只会玩《2048》的AI的,是一位巴西老哥Felipe Marcelino。目前正在米纳斯吉拉斯联邦大学攻读CS硕士。

首先,他采用OpenAI Gym构建了自定义强化学习环境。

其中包括两种2048棋盘表示方式:

  • 二进制——使用二次幂矩阵表示棋盘中的每一块区域

  • 非二进制——原始数字矩阵

模型包含两种类型的神经网络:CNN和MLP(多层感知机)。

据Felipe介绍,与MLP相比,以CNN作为特征提取器的智能体表现得更好。

训完之后,老哥测试了一下,在1000把游戏中,AI有100次达到了2048。

玩《2048》的AI们

目前,这只用DQN训练出的AI玩到2048就打住了。

不过,巴西老哥抛砖,又吸引了不少来献玉的盆友。

比如,同样采用强化学习方法,将时序差分学习最大期望搜索相结合的2048控制器。

在10步/秒的策略下,它最高能凑出32768

而在追求高分的路上,有一位来自日本的选手表现亮眼。

依靠7个卷积层的深度卷积网络,这只在《2048》这个游戏中最高拿到了401912分。

正如一位网友所说:这正是一个足够有趣,又不太复杂的强化学习案例。

如果你是刚刚开始学习强化学习,也不妨拿这个小项目练练手~

参考链接

《2048》相关开源项目:
https://github.com/FelipeMarcelino/2048-gym
https://github.com/aszczepanski/2048
https://github.com/thomasahle/mcts-2048/

相关论文:
https://www.jstage.jst.go.jp/article/ipsjjip/27/0/27_340/_pdf
http://arxiv.org/abs/1604.05085

觉得有用麻烦给个在看啦~  

你玩《2048》能拿多少分?AI的最高分纪录:401912相关推荐

  1. 我的名片能运行Linux和Python,还能玩2048小游戏,成本只要20元

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 猜猜它是什么?印着姓名.职位和邮箱,看起来是个名片.可是右下角有芯片,看起来又像是个PCB电路板. 其实它是一台超迷你的ARM计算机,不仅 ...

  2. python神经网络训练玩游戏_python – 如何训练神经网络来玩2048游戏?

    我想训练神经网络玩2048游戏.我知道NN对于像2048这样的状态游戏来说不是一个好选择,但是我想要实现NN将像经验丰富的人类一样玩游戏,即仅在三个方向上移动游戏. 但由于我们不知道有效输出,我无法弄 ...

  3. win8 android 跑分,Win8.1也能玩安兔兔跑分?蓝魔i10pro更多谍照

    Win8.1也能玩安兔兔跑分?蓝魔i10pro更多谍照 3月20日,蓝魔将在北京竞园艺术中心举行蓝魔新一代英特尔芯平板发布会,届时将会有多款采用英特尔芯的平板力作面世.在临近大会到来之际,在网上传得火 ...

  4. 4分钟训练ImageNet!腾讯机智创造AI训练世界纪录

    4分钟训练ImageNet! 腾讯机智创造AI训练世界纪录 by 腾讯机智团队 注:腾讯机智机器学习平台由TEG架构平台部和运营管理部团队携手,并和香港浸会大学计算机科学系褚晓文教授团队深度合作联袂打 ...

  5. 5位评委对参赛选手进行打分,将所有的打分结果存储到对应类型的数组中, 将所有的评分结果去除一个最低分,去除一个最高分,然后获取的平均分数为 选手的最终得分.设计程序,用键盘输入5位评委的评分,并打印输

    5位评委对参赛选手进行打分,将所有的打分结果存储到对应类型的数组中, 将所有的评分结果去除一个最低分,去除一个最高分,然后获取的平均分数为 选手的最终得分.设计程序,用键盘输入5位评委的评分,并打印输 ...

  6. AI 玩王者荣耀狂上分!打了六局,心态崩了

    你造吗?人工智能继进军围棋之后,又来我"王者峡谷"了. 腾讯AI LAB与王者荣耀合作开发的AI[绝悟],在最高规格赛事中获胜,宣布已达到"电竞职业水平"!据称 ...

  7. AI 玩王者荣耀狂上分!1 天训练强度达人类 440 年,网友:已卸载

    你造吗?人工智能继进军围棋之后,又来我"王者峡谷"了. 腾讯AI LAB与王者荣耀合作开发的AI[绝悟],在近期的最高规格赛事中获胜,宣布已达到"电竞职业水平" ...

  8. Android7玩游戏卡,玩游戏卡顿上分难?这几款高性能手机适合你

    [PConline 导购]随着科技的发展,人们生活习惯也发生变化,现如今年轻人的休闲娱乐方式越来越多样,比如手游就逐渐成为了一种全新的休闲娱乐方式.而对于经常玩手游的年轻人来说,上分吃鸡已经成为他们日 ...

  9. 你玩的音游可能真是AI生成的,Love Live!工作室发了篇论文,用AI节省50%作谱时间...

    萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 现在,你打的音游曲谱,还真有可能是AI生成的! 像下面这些根据节拍生成音符的操作,也就是谱面 (chart),现在AI也能搞出来了: 这是发生在著 ...

最新文章

  1. Blender3.0电影级别CG场景制作视频教程
  2. [JMX一步步来] 1、JMX的Hello World
  3. ICRA2022 | OPV2V: 首个大型自动驾驶协同感知数据集+代码框架已开源
  4. python动态创建类_Python中通过参数动态创建扩展类(class)
  5. dapper 注意事项之GUID
  6. 面向新闻媒体的命名实体识别技术
  7. hbuild 编译 php,Hbuilder的PHP环境搭建
  8. vv7无法启动显示发动机故障_发动机电控系统常见故障(发动机不能启动)的解决方法...
  9. 中国数控攻牙机市场趋势报告、技术动态创新及市场预测
  10. 【免费毕设】IT产品网上物流管理信息系统的设计与实现(源代码+lunwen)
  11. NetworkManagementService 解读
  12. 【力学】基于matlab立铣刀力模拟仿真【含Matlab源码 193期】
  13. 最新版chrome安装adblock插件
  14. 手游excel数据分析
  15. 描写计算机老师上课的神态,描写老师上课的神态的作文300字
  16. syswow64删除文件_syswow64,教您syswow64是什么文件夹
  17. 汉字 字库压缩ttf
  18. python将图片拼接为视频
  19. 阿里云oss 收费标准细则,太鸡贼了,不要傻傻的以为只收你存储的钱
  20. 中国56个民族sql语句

热门文章

  1. 刻意练习:Python基础 -- Task10. 类与对象
  2. IplImage 类型和 CvMat 类型转换为 Mat 类型
  3. 【ACM】奇怪的回文数
  4. 【CTF】实验吧 Fair-Play
  5. 谁是“艾灵”?是腾讯的真国风 AI 虚拟人!
  6. 又一个Jupyter神器,操作Excel自动生成Python代码
  7. 如何更新你的机器学习模型?手把手带你设计一个可持续的预测模型!
  8. 《评人工智能如何走向新阶段》后记(再续2)
  9. 深度学习在人脸检测中的应用 | CSDN 博文精选
  10. 谷歌开源张量网络库TensorNetwork,GPU处理提升100倍!