翻译Deep Learning and the Game of Go(3)第2章:围棋是一个机器学习难题(规则部分就不翻了)
本章涵盖
- 为什么游戏是AI的好项目?
- 为什么围棋是深度学习的难题?
- 围棋的规则是什么?
- 您可以通过机器学习解决游戏的哪些方面?
2.1 为什么要用游戏?
游戏是AI研究中最喜欢的主题,而不仅仅是因为它们很有趣。它们还简化了现实生活中的某些复杂性,因此您可以专注于正在研究的算法。
想象一下,您在Twitter或Facebook上看到一条评论:类似“呃,我忘记了我的雨伞。”您很快就会得出结论,您的朋友被雨淋了。但是该信息未包含在句子中的任何位置,那么您是如何得出这个结论的?首先,您应用了有关雨伞用途的常识。其次,您运用了有关人们烦恼地做出的评论的社交知识:在阳光明媚的晴天说“我忘记了雨伞”会很奇怪。
作为人类,我们在阅读句子时会毫不费力地考虑所有这些情况,但对于计算机而言,这并不是那么容易。现代的深度学习技术可以有效地处理您提供的信息。但是,您查找所有相关信息并将其提供给计算机的能力有限,而游戏回避了这个问题。它们发生在人工的宇宙中,在规则中已经阐明了您做出决定所需的所有信息。
游戏特别适合强化学习。回想一下,强化学习需要反复运行你的程序,并评估它完成任务的程度。想象一下你在用强化学习来训练机器人在建筑物周围移动。在对控制系统进行微调之前,你需要冒着机器人从楼梯上掉下来或撞翻你的家具的危险。另一种选择是一个让计算机可以操作的模拟环境,这样可以排除一个未经训练的机器人在现实世界中运行的风险,但是这样会产生新的问题。首先,你必须投资开发一个详细的计算机模拟环境,这是非常重要的。第二,你的模拟总是不完全准确的。
另一方面,在游戏中,你所需要做的就是让你的AI运行起来。如果它在学习的时候输了几十万场比赛,那又怎么样?在强化学习中,游戏对于严瑾的研究非常重要。许多前沿算法首先在Atari视频游戏(如Breakout)上得到了运用。
要清楚的是,你可以成功地将强化学习应用于解决物理世界中的问题。许多研究人员和工程师都这样做了。但是从游戏一开始,就解决了创造一个真实的训练环境的问题,并让你专注于强化的机制和原则。
在这一章中,我们介绍了围棋游戏的规则。然后,我们将会介绍高水平的,引入深度学习棋盘游戏AI的结构。最后,在整个开发过程中,我们将介绍如何评估您的游戏AI发展进步的效果。
2.2-2.4都是围棋规则,我就不翻了
2.5 我们能够教给机器什么?
不管你是在编程做围棋还是井字棋都没关系,大多数棋盘游戏AI都有着相似的整体结构。在本节中,我们提供了该结构的高级概述和AI需要解决的特定问题。依赖于游戏,最好的解决方案可能涉及游戏特定的逻辑或机器学习,又或者两者兼而有之。
2.5.1 布局阶段选择落子
2.6.如何衡量你的围棋AI的棋力
业余等级是根据两位棋手之间的棋力差所需的让子数来计算的。例如,如果爱丽丝2级,鲍勃5级,爱丽丝通常会给鲍勃让三子,使他们有平等的机会获胜。
专业级别就有点不同:它们更像是头衔。一个地区的围棋协将顶尖棋手进行排名,而这排名都是基于主要赛事的结果,并且这种排名终身持有的。业余水平和职业水平是不可直接比较的,但你可以假设任何一个有职业排名的职业棋手水平至少能达到业余7段的水平,而顶级职业选手明显比这种水平强。
2.6.2 衡量你的围棋AI
估计你的围棋AI的一个简单的方法就是与已知棋力的围棋AI相对抗。如GNUGo和Pachi那样的开源围棋引擎,就提供了很好的基准。GNU Go在5级左右的水平,而Pachi在1段左右。所以,如果你让你的围棋与GNUGo对抗100次,它如果赢得了大约50场比赛,你可以得出结论,你的围棋AI的水平也在5级左右。
为了获得更精确的等级,您可以让您的AI在带有评级系统的公共Go服务器上对弈,几十场比赛之后应该就可以得到一个合理的估计。
2.7 总结
- 游戏是人工智能研究的一个热门课题,因为它们具有已知规则
- 如今最强的围棋人工智能依靠的是机器学习而不是游戏特有的知识。部分原因是围棋具有大量可能的变化,而基于规则的围棋AI并不强大。
- 你可以在围棋中应用深度学习的两个地方是落子选择和盘面评估。
- 落子选择需要缩小在特定的棋盘盘面需要考虑的落子可能性数目。没有好的落子选择,你的围棋AI将有非常多的分支要去搜索。
- 盘面评估是估计哪方领先多少的问题。没有好的盘面评估,你的围棋AI将没有能力选择一个好的变化。
- 你可以通过对抗已知棋力的可用AI来测你的AI棋力,如GNUGo或Pachi
翻译Deep Learning and the Game of Go(3)第2章:围棋是一个机器学习难题(规则部分就不翻了)相关推荐
- [论文翻译] Deep Learning
[论文翻译] Deep Learning 论文题目:Deep Learning 论文来源:Deep learning Nature 2015 翻译人:BDML@CQUT实验室 Deep learnin ...
- [论文翻译]Deep Learning 翻译及阅读笔记
论文题目:Deep Learning 论文来源:Deep Learning_2015_Nature 翻译人:BDML@CQUT实验室 Deep Learning Yann LeCun∗ Yoshua ...
- [论文翻译]Deep learning
[论文翻译]Deep learning 论文题目:Deep Learning 论文来源:Deep Learning_2015_Nature 翻译人:BDML@CQUT实验室 Deep learning ...
- 翻译Deep Learning and the Game of Go(2)第1章:面向深度学习
第1章:面向深度学习 本章内容包括: 机器学习及其与传统编程的区别 机器学习无法解决的问题 机器学习与人工智能的关系 机器学习系统的结构 机器学习学科 只要存在计算机,程序员就对人工智能(AI)感兴趣 ...
- 文献翻译 Deep Learning
该篇文章为18年图灵奖得主,被誉为"深度学习之父"的Lecun.Bengio.Hinton三位业界巨擘共同发表在Nature上的关于深度学习的综述,DOI:10.1038/natu ...
- 翻译Deep Learning and the Game of Go(10)第八章:部署你的AI
本章包括: 构建一个端到端的应用程序来训练和运行一个围棋机器人 在前端运行来对抗你的机器人 让你的机器人在本地与其他机器人对抗. 部署到在线围棋服务器 到目前为止,你已经知道如何为围棋落子预测去构建和 ...
- 翻译Deep Learning and the Game of Go(10)第七章:从数据中学习:一个深度学习AI
本章包括 下载和处理实际的围棋游戏记录 了解存储围棋游戏的标准格式 训练一个使用这样的数据进行落子预测的深度学习模型 运行自己的实验并评估它们 在前一章中,您看到了构建深度学习应用程序的许多基本要素, ...
- 翻译Deep Learning and the Game of Go(5)第3章:实现你第一个围棋AI(下)
3.4 创建你第一个AI:可以想见的最弱AI 在实现了围棋棋盘和游戏状态类之后,您可以构建您的第一个围棋AI.这个机器人将是一个很弱的玩家,但它将为你的后续所有改进奠定基础.首先,您需要定义所有机器人 ...
- 翻译Deep Learning and the Game of Go(8)第六章:给围棋数据设计神经网络(上)
本章包括(篇幅关系,本文章介绍前两个,后两个放在下个文章) 构建一个深度学习应用程序从数据出发来预测下一步的围棋落子点 引入Keras深度学习框架 了解卷积神经网络 构建分析空间围棋数据的神经网络 在 ...
最新文章
- 2014第12周二学习记
- 【经验分享】非科班出身怎么转行计算机?
- @scheduled注解配置时间_Java开发重写Spring Boot定时任务,支持可动态调整执行时间...
- SharePoint 2013 本地创建解决方案
- javaSocket编程TCP
- 蓝桥 盾神与积木游戏(Java)
- 英语单词在计算机中怎么存放,电脑怎么学英语单词
- Linux升级ilo,利用HP iLO4安装系统
- Esxi 5下ROS5.18+Panabit
- python的selenium的带https安全隐私问题解决方案
- 【机器学习基础】最大边缘分类器
- 电商客服售前售后话术培训资料合集(共150份)
- 2019辽宁公务员考试:逻辑填空词语的“ 合并同类项”
- 计算机原理-浮点数存储
- matlab解对流方程初值问题,对流方程——偏微分方程的数值解法
- Pytorch数据使用列表的卷积层时报错及解决-RuntimeError: Input type (torch.cuda.HalfTensor) and weight type (torch.Floa
- 小米扫地机器人充电座指示灯不亮_扫地机器人常见问题及故障排除
- 今日热榜已成过去式?这个全新的热点神器,你一定要知道!
- 禁止穿透 uniapp
- GPS 车辆追踪软件 GIS系统和分布式
热门文章
- 亿美软通史东旭:5G消息热潮下的安全冷思考丨5GMASSAGING · 上海站预告
- recv/send堵塞和非堵塞
- Python-Flask开发微电影网站(八)
- python从网址爬图片协程_python协程gevent案例 爬取斗鱼图片过程解析
- 春秋云镜靶场Initial-WriteUP 专业徽章手把手教学
- 求斐波那契数列的第n项
- C++ 宽、窄字符转换
- Sublime Text 3之soda超酷主题安装及配置方法
- 微信气泡主题设置_微信气泡主题怎么设置_微信气泡主题怎么设置方法_掌通手游...
- python 隐函数作图(原创简单方法)