作者 | 李秋键

责编 | 郭   芮

出品 | CSDN(ID:CSDNnews)

近几年来,AI在游戏方面的发展如火如荼,尤其是自从阿法狗AI围棋战胜围棋之后,更是引起了AI发展的狂潮,同时也引起了很多AI游戏的应用与深化发展。其实游戏中的AI有着非常悠久的历史,相当多的游戏都是围绕着对抗“敌人”展开,而这个“敌人”,就是AI,其中包含一些行为方式固定没有一丁点变化的低级AI,也有一些引入随机因素稍微高级一点的AI,不过这里的AI本质上是一段固定的程序脚本,如果玩家掌握到其中的规律,游戏性就会瞬间降低。

而深度学习的AI版本却是不同,他有着多层位的参数与多方向的选择,拓展了其中AI的智能性,让玩家找到其中的规律性变得基本不可能,这也是深度学习的重要意义之一。今天,我们就将利用CNN实现智能五子棋。

实验前的准备

首先我们使用的python版本是3.6.5。所测试的系统有windows10,windows7,Linux系统以及苹果系统。从这点也可以看出python多平台和多拓展性、易于迁移的优点。

所使用的的python库有tkinter,其目的是用来规划棋盘布局,实现下棋功能;SGFfile用来读取棋谱和加载训练模型;os库用来读取和存储本地文件;TensorFlow库用来建立CNN网络模型以及训练等事项。

棋盘的建立

1、初始化棋盘:

其中各参数设定意义如下:初始化:someoneWin:标识是否有人赢了;humanChessed:人类玩家是否下了;IsStart:是否开始游戏了;player:玩家是哪一方;playmethod:模式,和robot下棋,还是和ai下棋;bla_start_pos:黑棋开局时下在正中间的位置;bla_chessed:保存黑棋已经下过的棋子;whi_chessed:保存白棋已经下过的棋子;board:棋盘;window:窗口;var:用于标记选择玩家颜色的一个变量;var1:用于标记选择robot或者ai的一个变量;can:画布,用于绘出棋盘;net_board:棋盘的点信息;robot:机器人;sgf:处理棋谱;cnn:cnnc神经网络。

其中代码如下:

def __init__(self):self.someoneWin = Falseself.humanChessed = Falseself.IsStart = Falseself.player = 0self.playmethod = 0self.bla_start_pos = [235, 235]self.whi_chessed = []self.bla_chessed = []self.board = self.init_board()self.window = Tk()self.var = IntVar()self.var.set(0)self.var1 = IntVar()self.var1.set(0)self.window.title("myGoBang")self.window.geometry("600x470+80+80")self.window.resizable(0, 0)self.can = Canvas(self.window, bg="#EEE8AC", width=470, height=470)self.draw_board()self.can.grid(row=0, column=0)self.net_board = self.get_net_board()self.robot = Robot(self.board)self.sgf = SGFflie()self.cnn = myCNN()self.cnn.restore_save()def init_board(self):"""初始化棋盘"""list1 = [[-1]*15 for i in range(15)]return list1

2、棋盘布局:

其主要功能就是画出棋盘和棋子。具体代码如下:

def draw_board(self):"""画出棋盘"""for row in range(15):if row == 0 or row == 14:self.can.create_line((25, 25 + row * 30), (445, 25 + row * 30), width=2)else:self.can.create_line((25, 25 + row * 30), (445, 25 + row * 30), width=1)for col in range(15):if col == 0 or col == 14:self.can.create_line((25 + col * 30, 25), (25 + col * 30, 445), width=2)else:self.can.create_line((25 + col * 30, 25), (25 + col * 30, 445), width=1)self.can.create_oval(112, 112, 118, 118, fill="black")self.can.create_oval(352, 112, 358, 118, fill="black")self.can.create_oval(112, 352, 118, 358, fill="black")self.can.create_oval(232, 232, 238, 238, fill="black")self.can.create_oval(352, 352, 358, 358, fill="black")
def draw_chessed(self):"""在棋盘中画出已经下过的棋子"""if len(self.whi_chessed) != 0:for tmp in self.whi_chessed:oval = pos_to_draw(*tmp[0:2])self.can.create_oval(oval, fill="white")if len(self.bla_chessed) != 0:for tmp in self.bla_chessed:oval = pos_to_draw(*tmp[0:2])self.can.create_oval(oval, fill="black")def draw_a_chess(self, x, y, player=None):"""在棋盘中画一个棋子"""_x, _y = pos_in_qiju(x, y)oval = pos_to_draw(x, y)if player == 0:self.can.create_oval(oval, fill="black")self.bla_chessed.append([x, y, 0])self.board[_x][_y] = 1elif player == 1:self.can.create_oval(oval, fill="white")self.whi_chessed.append([x, y, 1])self.board[_x][_y] = 0else:print(AttributeError("请选择棋手"))return

3、判断胜负条件:

根据是否是五子连在一线判断输赢。

def have_five(self, chessed):"""检测是否存在连五了"""if len(chessed) == 0:return Falsefor row in range(15):for col in range(15):x = 25 + row * 30y = 25 + col * 30if self.check_chessed((x, y), chessed) == True and \self.check_chessed((x, y + 30), chessed) == True and \self.check_chessed((x, y + 60), chessed) == True and \self.check_chessed((x, y + 90), chessed) == True and \self.check_chessed((x, y + 120), chessed) == True:return Trueelif self.check_chessed((x, y), chessed) == True and \self.check_chessed((x + 30, y), chessed) == True and \self.check_chessed((x + 60, y), chessed) == True and \self.check_chessed((x + 90, y), chessed) == True and \self.check_chessed((x + 120, y), chessed) == True:return Trueelif self.check_chessed((x, y), chessed) == True and \self.check_chessed((x + 30, y + 30), chessed) == True and \self.check_chessed((x + 60, y + 60), chessed) == True and \self.check_chessed((x + 90, y + 90), chessed) == True and \self.check_chessed((x + 120, y + 120), chessed) == True:return Trueelif self.check_chessed((x, y), chessed) == True and \self.check_chessed((x + 30, y - 30), chessed) == True and \self.check_chessed((x + 60, y - 60), chessed) == True and \self.check_chessed((x + 90, y - 90), chessed) == True and \self.check_chessed((x + 120, y - 120), chessed) == True:return Trueelse:passreturn Falsedef check_win(self):"""检测是否有人赢了"""if self.have_five(self.whi_chessed) == True:label = Label(self.window, text="White Win!", background='#FFF8DC', font=("宋体", 15, "bold"))label.place(relx=0, rely=0, x=480, y=40)return Trueelif self.have_five(self.bla_chessed) == True:label = Label(self.window, text="Black Win!", background='#FFF8DC', font=("宋体", 15, "bold"))label.place(relx=0, rely=0, x=480, y=40)return Trueelse:return False

得到的UI界面如下:

深度学习建模

1、初始化神经网络:

其中第一层和第二层为卷积层,第四层为全连接层,接着紧接着连接池化和softmax。和一般的CNN网络基本无异。基本参数见代码,如下:

def __init__(self):'''初始化神经网络'''self.sess = tf.InteractiveSession()# parasself.W_conv1 = self.weight_varible([5, 5, 1, 32])self.b_conv1 = self.bias_variable([32])# conv layer-1self.x = tf.placeholder(tf.float32, [None, 225])self.y = tf.placeholder(tf.float32, [None, 225])self.x_image = tf.reshape(self.x, [-1, 15, 15, 1])self.h_conv1 = tf.nn.relu(self.conv2d(self.x_image, self.W_conv1) + self.b_conv1)self.h_pool1 = self.max_pool_2x2(self.h_conv1)# conv layer-2self.W_conv2 = self.weight_varible([5, 5, 32, 64])self.b_conv2 = self.bias_variable([64])self.h_conv2 = tf.nn.relu(self.conv2d(self.h_pool1, self.W_conv2) + self.b_conv2)self.h_pool2 = self.max_pool_2x2(self.h_conv2)# full connectionself.W_fc1 = self.weight_varible([4 * 4 * 64, 1024])self.b_fc1 = self.bias_variable([1024])self.h_pool2_flat = tf.reshape(self.h_pool2, [-1, 4 * 4 * 64])self.h_fc1 = tf.nn.relu(tf.matmul(self.h_pool2_flat, self.W_fc1) + self.b_fc1)# dropoutself.keep_prob = tf.placeholder(tf.float32)self.h_fc1_drop = tf.nn.dropout(self.h_fc1, self.keep_prob)# output layer: softmaxself.W_fc2 = self.weight_varible([1024, 225])self.b_fc2 = self.bias_variable([225])self.y_conv = tf.nn.softmax(tf.matmul(self.h_fc1_drop, self.W_fc2) + self.b_fc2)# model trainingself.cross_entropy = -tf.reduce_sum(self.y * tf.log(self.y_conv))self.train_step = tf.train.AdamOptimizer(1e-3).minimize(self.cross_entropy)self.correct_prediction = tf.equal(tf.argmax(self.y_conv, 1), tf.argmax(self.y, 1))self.accuracy = tf.reduce_mean(tf.cast(self.correct_prediction, tf.float32))self.saver = tf.train.Saver()init = tf.global_variables_initializer()  # 不存在就初始化变量self.sess.run(init)def weight_varible(self, shape):'''权重变量'''initial = tf.truncated_normal(shape, stddev=0.1)return tf.Variable(initial)def bias_variable(self, shape):'''偏置变量'''initial = tf.constant(0.1, shape=shape)return tf.Variable(initial)def conv2d(self, x, W):'''卷积核'''return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')def max_pool_2x2(self, x):'''池化核'''return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

2、保存和读取模型:

def restore_save(self, method=1):'''保存和读取模型'''if method == 1:self.saver.restore(self.sess, 'save\model.ckpt')#print("已读取数据")elif method == 0:saver = tf.train.Saver(write_version=tf.train.SaverDef.V2)saver.save(self.sess, 'save\model.ckpt')#print('已保存')

3、建立预测函数和训练函数:

def predition(self, qiju):'''预测函数'''_qiju = self.createdataformqiju(qiju)pre = self.sess.run(tf.argmax(self.y_conv, 1), feed_dict={self.x: _qiju, self.keep_prob: 1.0})point = [0, 0]l = pre[0]for i in range(15):if ((i + 1) * 15) > l:point[0] = int(i*30 + 25)point[1] = int((l - i * 15) * 30 + 25)breakreturn pointdef train(self, qiju):'''训练函数'''sgf = SGFflie()_x, _y = sgf.createTraindataFromqipu(qiju)for i in range(10):self.sess.run(self.train_step, feed_dict={self.x: _x,self.y: _y})self.restore_save(method=0)def train1(self, x, y):'''另一个训练函数'''for i in range(100):self.sess.run(self.train_step, feed_dict={self.x: x,self.y: y,self.keep_prob: 0.5})print('训练好了一次')#self.restore_save(method=0)

4、生成数据:

def createdataformqiju(self, qiju):'''生成数据'''data = []tmp = []for row in qiju:for point in row:if point == -1:tmp.append(0.0)elif point == 0:tmp.append(2.0)elif point == 1:tmp.append(1.0)data.append(tmp)return data

其中此处CNN在棋盘应用和图像识别的不同之处在于,图像识别加载的参数来自于图像本身的像素值作为训练的参数,而此处训练的参数则是自定义的棋盘棋谱参数,比如说棋盘左上角的位置参数等等各个位置参数都是预先设定好的,通过加载棋谱即可以让电脑知道此时黑白棋子在哪个位置。然后通过加载各个位置以及胜负情况进行判断,最终电脑加载模型即可预测可能胜利的下棋位置,达到智能下棋效果。

最终效果:

作者简介:李秋键,CSDN 博客专家,CSDN达人课作者。硕士在读于中国矿业大学,开发有安卓武侠游戏一部,VIP视频解析,文意转换写作机器人等项目,发表论文若干,多次高数竞赛获奖等等。

声明:本文为作者原创投稿,未经允许请勿转载。

【End】

《原力计划【第二季】- 学习力挑战》正式开始!
即日起至 3月21日,千万流量支持原创作者,更有专属【勋章】等你来挑战

推荐阅读 

☞谁说国产编译器没救了?这个 C/C++ 和 JavaScript 编译器来了 | 程序人生 2020

☞中国开发者真实画像:Java长盛,偏爱Windows操作系统,鲜少参与开源项目

☞用于小型图形挖掘研究的瑞士军刀:空手道俱乐部的图表学习Python库

☞罗永浩欲直播带货,京东说可以帮忙联系

☞MySQL数据库无完整备份删库,除了跑路还能怎么办?

☞Libra新编程语言 :Move 的所有权模型灵感来源原来是它……

你点的每一个在看,我认真当成了喜欢

如何用 CNN 玩转 AlphaGo 版的五子棋?相关推荐

  1. 如何用CNN玩转AlphaGo版的五子棋?

    作者 | 李秋键 责编| 郭芮 出品| CSDN(ID:CSDNnews) 近几年来,AI在游戏方面的发展如火如荼,尤其是自从阿法狗AI围棋战胜围棋之后,更是引起了AI发展的狂潮,同时也引起了很多AI ...

  2. 苍蓝誓约如何用电脑玩 苍蓝誓约PC电脑版玩法教程

    <苍蓝誓约>是一款采用了二次元风格的战斗类手游,游戏中有着非常精美的次元卡通画面风格,众多唯美的次元卡通角色任你收集培养,还有众多独创的创新玩法,让你享受最独特的次元世界!下面小编就给亲们 ...

  3. 原神ios android,原神苹果版如何用电脑玩 原神ios电脑版玩法教程

    原标题:原神苹果版如何用电脑玩 原神ios电脑版玩法教程 现在有很多小伙伴都在玩原神手游,不过相对于传统的在手机上进行游戏,很多人都倾向于新玩法,就是在电脑上玩原神手游.下面小编就给亲们介绍下原神io ...

  4. 狐妖小红娘手游如何用电脑玩 狐妖小红娘手游PC电脑版教程

    <狐妖小红娘>手游是根据同名人气动漫改编而成的,游戏高度还原了动漫中的剧情,人物也是制作的更加精致,瞬间让我们融入动漫中去.全新的日系风格设计,各种萌妹子登场,讲诉一段离奇的人妖恋!下面小 ...

  5. 雪鹰领主手游如何用电脑玩 雪鹰领主手游PC电脑版教程

    <雪鹰领主>手游是腾讯旗下的一款玄幻3DMMO巨作,同时它也是人气小说雪鹰领主改编而成,游戏除了还原小说剧情,同时还融入了许多游戏元素,我们可以体验超凡入圣的修炼过程,也可以为爱而战!下面 ...

  6. 地下城与勇士M如何用电脑玩 地下城与勇士M电脑版教程

    <地下城与勇士M>是一款根据端游同款游戏改编而来的冒险挑战类手机游戏.在这个暗黑的世界之中,你需要化身为一个超级无比的勇士,你不仅仅需要拥有超级震撼的完美炫斗技能大招,简单畅爽的操作,带你 ...

  7. 三生三世十里桃花用计算机怎么弄,三生三世十里桃花ios如何用电脑玩 三生三世十里桃花ios模拟器教程...

    原标题:三生三世十里桃花ios如何用电脑玩 三生三世十里桃花ios模拟器教程 现在有很多小伙伴都在玩三生三世十里桃花手游,不过相对于传统的在手机上进行游戏,很多人都倾向于新玩法,就是在电脑上玩三生三世 ...

  8. 三生三世十里桃花用计算机怎么弄,三生三世十里桃花ios如何用电脑玩 三生三世十里桃花ios电脑教程...

    现在有很多小伙伴都在玩三生三世十里桃花手游,不过相对于传统的在手机上进行游戏,很多人都倾向于新玩法,就是在电脑上玩三生三世十里桃花手游.下面小编就给亲们介绍下三生三世十里桃花ios电脑版教程哈! 1. ...

  9. linux 商业游戏,Ubuntu下安装试玩原生Linux版商业游戏Braid

    这款原生Linux版商业游戏Braid国外出售价大约在80美元左右.每年在Linux平台上发布的原生商业游戏是屈指可数,而且这些游戏的质量也是参差不齐. 不过这款原生Linux版商业游戏Braid还是 ...

最新文章

  1. Ant Design Pro 网络请求流程
  2. 混淆梯度(Obfuscated Gradients Give a False Sense of Security Circumventing Defense)
  3. 教程 | 单级式目标检测方法概述:YOLO与SSD
  4. Python+Selenium自动化
  5. Linux iptables
  6. postgres复制表结构
  7. el-table某列的列宽自适应,其他列按比例分配。
  8. 投票选举 算法_区块链主流共识算法一文全通
  9. 一个女算法程序媛的日常
  10. [luogu1081] 开车旅行
  11. JVM监控及诊断工具命令行篇之jstat
  12. CKPlayer网页视频播放器
  13. 数字化转型|利用现代技术和通信手段|改变企业为客户创造价值的方式
  14. Nginx搭建文件服务器(解决无法下载文件.txt,.pdf等)
  15. python父亲节礼物送什么_父亲节送什么礼物好
  16. python试卷管理系统的设计与实现_在线考试系统的设计与实现毕业设计论文.doc...
  17. PCDMIS 零件坐标系创建技巧 4
  18. C++输入0结束循环
  19. 帝国霸业服务器无限加载,帝国霸业银河生存控制台有哪些指令 控制台指令一览...
  20. JVM老生代增长过快问题排查

热门文章

  1. 设置 cookie过期时间
  2. HDU 4722 Good Numbers 2013年四川省赛题
  3. 在Windows宿主机中ssh连接虚拟机CentOS中的Docker容器
  4. 人工智能必备数学知识· 学习笔记 ·002【马尓可夫链,马尓可夫链奖励过程,马尔可夫决策过程】
  5. [论文写作] vscode + latex
  6. exchange创建邮箱组_Exchange批量创建用户组及启用通讯组邮箱-阿里云开发者社区...
  7. opencv有基于c语言的教程吗_VS2019配置opencv详细图文教程和测试代码的实现
  8. [译]R语言——Shiny框架之构建(一):1.结构——1.独立应用程序——1.应用的格式和启动
  9. opencv+resize+padding+concate
  10. 中国甜叶菊乳制品市场趋势报告、技术动态创新及市场预测