深度学习(三十二)——AlphaGo, AlphaStar
AlphaGo
樊麾讲解AlphaGo与李世石的五番棋:
https://deepmind.com/research/alphago/alphago-games-simplified-chinese/
论文:
《Mastering the game of Go with deep neural networks and tree search》
DarkForest
DarkForest是田渊栋2015年11月的作品,虽然棋力和稍后的AlphaGo相去甚远,但毕竟也算是用到了RL和DNN了。
代码:
https://github.com/facebookresearch/darkforestGo
Leela Zero
Leela Zero是比利时人Gian-Carlo Pascutto开源的围棋AI。它的算法与AlphaGo Zero相同。而训练采用GTP协议,集合全球算力,进行分布式训练。
官网:
http://zero.sjeng.org/
代码:
https://github.com/gcp/leela-zero
十多年前,当我还是一个中二青年的时候,就幻想有朝一日能够拿围棋世界冠军。当然,就算再中二,我自己也明白靠实力那是不可能的,当时做梦的法宝是制造一个AI,然后碾压一下所谓的国手。
按照当时(2000年前后)人们的预计,这个AI在2030年之前,都不可能造出来,然而,最终的结果实际上只花了一半左右的时间。
再之后,随着AI围棋的平民化,我的中二梦终于也有人将之付诸实现了:
https://mp.weixin.qq.com/s/npt2zZrKwPnNdY-hsa2RjQ
AI再乱围棋圈:“食言之战”柯洁落败;首例素人作弊引风波
这次作弊风波所使用的AI就是Leela Zero,可见目前(2018.5)它的棋力已经超过了顶尖棋手。
ELF OpenGo
ELF OpenGo是Facebook开源的围棋AI,它是FB的AI游戏框架ELF的一部分。
官网:
https://github.com/pytorch/ELF
参考:
https://mp.weixin.qq.com/s/lOAx3suLIS-pEWyi8xZl6Q
“全民体验”AlphaZero:FAIR田渊栋首次开源超级围棋AI
PhoenixGo
PhoenixGo是腾讯微信团队的AlphaGo Zero复刻版。
官网:
https://github.com/Tencent/PhoenixGo
参考:
https://mp.weixin.qq.com/s/tJDmxsuS1QigYS75ZIdzRA
微信团队开源围棋AI技术PhoenixGo,复现AlphaGo Zero论文
参考
https://mp.weixin.qq.com/s/Sfv-jzQAkN0PsZOGZUQhkQ
AlphaGo Zero横空出世,DeepMind Nature论文解密不使用人类知识掌握围棋
https://mp.weixin.qq.com/s/oAxouYX7-wDC5okbu--Wuw
Nature重磅:人工智能从0到1, 无师自通完爆阿法狗100-0
https://zhuanlan.zhihu.com/p/30262872
关于AlphaGo Zero
https://zhuanlan.zhihu.com/p/30263585
DeepMind新一代围棋程序AlphaGo Zero再次登上Nature
https://www.zhihu.com/question/66861459
如何评价DeepMind发表在Nature上的AlphaGo Zero?
http://www.alphago-games.com/
AlphaGo的棋谱
https://deepmind.com/blog/alphago-zero-learning-scratch/
AlphaGo Zero官方声明
https://zhuanlan.zhihu.com/mathNote
某牛的专栏,主要讲自制AlphaGo
https://mp.weixin.qq.com/s/DC9QqHdWT0xFnowEBuJDbw
自动化所解读“深度强化学习”:从AlphaGo到AlphaGoZero
https://mp.weixin.qq.com/s/uZtaxRwROCqYmL2k6Muxaw
从阿尔法狗元(AlphaGo Zero)的诞生看终极算法的可能性
https://mp.weixin.qq.com/s/i5OmLu8aNbypiTUmP4teeQ
刘遥行:深入浅出看懂AlphaGo Zero
https://mp.weixin.qq.com/s/aBrwbB_DOGTen-6XL7LGFQ
邓侃:白话蒙特卡洛树搜索和ResNet
https://mp.weixin.qq.com/s/nbTkr0PImlXUSYl91HD91Q
AlphaGo背后的力量:蒙特卡洛树搜索入门指南
https://mp.weixin.qq.com/s/-tH7DQo1cK9gA0bcpBJSDA
AlphaGo Zero:笔记与伪代码
https://mp.weixin.qq.com/s/CJuVoOf7idUChFIn7dH0Lg
围棋中的数学原理
https://mp.weixin.qq.com/s/d46qNFaftt4wxpV4sZnG-w
一张图看懂AlphaGo Zero
https://zhuanlan.zhihu.com/p/31749249
比AlphaGo Zero更强的AlphaZero问世,8小时解决一切棋类!
https://mp.weixin.qq.com/s/L7bZMkqyncwEt6D5tK1OdQ
AlphaZero炼成最强通用棋类AI,DeepMind强化学习算法8小时完爆人类棋类游戏
https://mp.weixin.qq.com/s/tFdnxqV5a5xZrFtB6E0AiQ
新AlphaZero出世称霸棋界,8小时搞定一切棋类!自对弈通用强化学习无师自通!
https://mp.weixin.qq.com/s/qYWsFBKNCKCGUmizX_1sVg
AlphaGo 教学工具终于上线了!
https://mp.weixin.qq.com/s/JxbIeDk8_wnYu_ewUHp29g
深度学习与围棋实战书籍《Deep Learning and the Game of Go》
https://mp.weixin.qq.com/s/gsRnbknytz2FY2dWgdWEYg
精通国际象棋的AI研究员:AlphaZero真的是一次突破吗?
https://mp.weixin.qq.com/s/Przl4ivbNuOFmz4pcYTrpQ
浅述:从Minimax到AlphaZero,完全信息博弈之路(1)
https://zhuanlan.zhihu.com/p/32089487
AlphaZero实战:从零学下五子棋
http://mp.weixin.qq.com/s/72riTTC3w0q9oF5H-51kXA
手把手教你搭建AlphaZero(使用Python和Keras)
https://mp.weixin.qq.com/s/Qw2tT7H1PwDvPgOYy8YUsQ
AlphaGo Zero代码迟迟不开源,TF等不及自己推了一个
https://mp.weixin.qq.com/s/Vq-osjgNXJQu5avGkxQdsw
手把手:AlphaGo有啥了不起,我也能教你做一个
https://mp.weixin.qq.com/s/ajajJ9yJZsOy4Vc0ULBxXg
国际象棋版AlphaZero出来了诶,还开源了Keras实现
https://zhuanlan.zhihu.com/p/41814142
从源码解密AlphaGo Zero背后基本原理
https://www.ifanr.com/630602
AlphaGo的棋局,与人工智能有关,与人生无关
https://mp.weixin.qq.com/s/J0w6kzzdKTbsaiZitbQdoA
达观数据:一文详解AlphaGo原理
https://mp.weixin.qq.com/s/BBQ54HHrFiqxXkC-EI6ELw
Science封面:AlphaZero达成终极进化体,史上最强棋类AI降临!
https://mp.weixin.qq.com/s/Pgw_xaCNl_kCPCg8NFzUBQ
人类没法下了!DeepMind贝叶斯优化调参AlphaGo,自弈胜率大涨16.5%
https://mp.weixin.qq.com/s/eE3oL6c5zHmTglHE-dgBvg
详解AlphaGo到AlphaGo Zero!
AlphaStar
https://mp.weixin.qq.com/s/_Y0bCjTu9UrHfnen15htqQ
AlphaStar称霸星际争霸2!AI史诗级胜利,DeepMind再度碾压人类
https://mp.weixin.qq.com/s/axr5VFbHQmYo0shW9ilBaQ
DeepMind回应一切:AlphaStar两百年相当于人类多长时间?
https://www.zhihu.com/question/310011363
如何评价DeepMind在北京时间19年1月25日2点的《星际争霸 2》项目演示?
https://mp.weixin.qq.com/s/k0l2uoik-Z9aA9zax7AoZg
中科院自动化所深度解析:Deepmind AlphaStar如何战胜人类职业玩家
https://zhuanlan.zhihu.com/p/55781614
AlphaStar背后的机器学习原理
httphttps://zhuanlan.zhihu.com/p/56043646管饭s://zhuanlan.zhihu.com/p/56043646
https://zhuanlan.zhihu.com/p/56043646
AlphaStar之IMPALA
https://mp.weixin.qq.com/s/XljE82cJZfFOgf2KrXWSKA
DeepMind首个战胜星际2职业玩家的AI为何无敌?新视角揭秘AI里程碑
深度学习(三十二)——AlphaGo, AlphaStar相关推荐
- 推荐系统遇上深度学习(三十九)-推荐系统中召回策略演进!
推荐系统中的核心是从海量的商品库挑选合适商品最终展示给用户.由于商品库数量巨大,因此常见的推荐系统一般分为两个阶段,即召回阶段和排序阶段.召回阶段主要是从全量的商品库中得到用户可能感兴趣的一小部分候选 ...
- Tensorflow深度学习之十二:基础图像处理之二
Tensorflow深度学习之十二:基础图像处理之二 from:https://blog.csdn.net/davincil/article/details/76598474 首先放出原始图像: ...
- 前几帧预测 深度学习_使用深度学习从十二导联心电图预测心律失常
上集讲到 使用深度学习 从单导联预测房颤 这一集 将继续讨论该问题 单导联心电图 对心律失常的预测作用 非常有限 因为 单导联的信号很有限 临床上需要结合 多导联心电图 判断 心律失常的类型 这一集的 ...
- 花书+吴恩达深度学习(十二)卷积神经网络 CNN 之全连接层
目录 0. 前言 1. 全连接层(fully connected layer) 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔~我会非常开心的~ 花书+吴恩达深度学习(十)卷积神经网络 CNN ...
- 深度学习三十年创新路
深度学习三十年创新路 编者注:深度学习火了,从任何意义上,大家谈论它的热衷程度,都超乎想象.但是,似乎很少有人提出不同的声音,说深度学习的火热,有可能是过度的繁荣,乃至不理性的盲从.而这次,有不同的想 ...
- 32.深度解密三十二:详解影响QQ群整体排名的那些秘密
网络营销推广技术.技巧深度解密(三十二)指南: 1.本文档适合零基础以及互联网营销推广人员,主要讲解营销QQ群排名的一些问题. 2.原创版权文档,任何抄袭或者全部.部分模仿都是侵权行为. 3.敬畏法律 ...
- 【深度学习】深度学习三十问!一位算法工程师经历30+场CV面试后总结的常见问题合集(含答案)...
作者丨灯会 来源丨极市平台 编辑丨极市平台 导读 作者灯会为21届中部985研究生,凭借自己整理的面经,去年在腾讯优图暑期实习,七月份将入职百度cv算法工程师.在去年灰飞烟灭的算法求职季中,经过30+ ...
- torch学习 (三十二):周杰伦歌词数据集与长短期记忆 (LSTM)
文章目录 1 引入 2 长短期记忆 2.1 输入门.遗忘门和输出门 2.2 候选记忆细胞 2.3 记忆细胞 2.4 隐藏状态 3 代码 致谢 1 引入 本文介绍一种常用的门控循环神经网络:长短期记 ...
- 深度学习三十问!一位算法工程师经历30+场CV面试后总结的常见问题合集(含答案)...
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨灯会 来源丨极市平台 编辑丨极市平台 极市导读 作者灯会为21届中部985研究生,凭借自己整理的 ...
- 深度学习(十二)稀疏自编码
稀疏自编码 原文地址:http://blog.csdn.net/hjimce/article/details/49106869 作者:hjimce 一.相关理论 以前刚开始学CNN的时候,就是通过阅读 ...
最新文章
- c语言求跳水运动员成绩,跳水排名_C语言编程实例_C语言_最全面的网站教程
- TI-DM8127:MCFW、ISS中对sensor的驱动和控制
- 记阿里的一次壮烈牺牲
- 数据库-日期计算-获取年月日
- win10+tensorflow faster-RCNN 训练自己的数据集
- 公有云与私有云的差别(转)
- ASP.NET MVC中在Action获取提交的表单数据方法总结 (4种方法,转载备忘)
- BST-V51开发板用c语言,小代码 向原文学习 BST 简单的C语言版本
- 从我的简历再谈测试分类
- 从零学ELK系列(九):Nginx接入ELK(超详细图文教程)
- Oralce 导入dpm 文件数据
- 银行如何构建反欺诈模型
- Elite Software DuctSize v6.01.224 1CD(风管测算软件)
- 关于LYNC同步通讯录参数修改
- 岸上的猫和水里的老鼠
- 高清屏智能手表PSRAM存储芯片APS6404L-SQR-ZR
- 游戏运营相关名词及解释
- 一百个最有用的网站地址
- 近红外光谱预测苹果糖度
- Linux的基础配置