Deep Mind用AlphaZero开发国际象棋新规则-3!
道翰天琼认知智能机器人平台API接口大脑为您揭秘。还记得《生活大爆炸》里谢耳朵完虐舍友伦纳德时玩的三维国际象棋吗?三维国际象棋或者空间国际象棋指任何一种在空间中(也就是不局限于一个平面棋盘)的棋类游戏。从20世纪早期就有这种象棋形式,最早的版本之一是“德国式空间国际象棋”,并在《星际迷航》系列中频频出现,后来也被用到了《生活大爆炸》中,是典型的理工男影视道具。三维国际象棋或许难度太高,但如果只是稍微改改二维的国际象棋规则,会带来什么不一样的体验呢?只是对于棋类游戏而言,规则非常重要,往往牵一发而动全身。如果改的不好,很可能会导致游戏变得不公平,或者无趣。但要确认新规则的有效性,特别是对于国际象棋这类探索空间非常大的游戏,需要大量的玩家玩大量的游戏后,才能确定新规则是否公平,新游戏是否有趣。有没有更智能的方法呢?当然有!这一次,DeepMind创始人Demis Hassabis联手国际象棋世界冠军Vladimir Kramnik,用AlphaZero玩出了新花样。他们尝试了多种不同的国际象棋变体,每一种变体都对经典国际象棋的规则做了些许改变,并用AlphaZero在新规则下进行自我对弈(self-play)。Vladimir Kramnik是俄罗斯国际象棋特级大师,并且2000年至2007年间的国际象棋世界冠军。2017 年底,DeepMind 发表了 AlphaZero的论文,AlphaZero是可以从零开始自学国际象棋、将棋和围棋的系统,并最终在这三个棋类游戏上都打败了世界最顶尖的程序。2018年底,DeepMind 对 AlphaZero 进行全面评估的论文发表在Science封面上。AlphaZero不需要任何内置的人类专业知识,只知道基本的游戏规则,并从随机游戏开始训练,就能实现世界最强。所以,用AlphaZero来探索新规则下的国际象棋非常合适。
1
9种新型国际象棋
设计一套足够吸引人、而且公平的游戏规则并非易事。现代国际象棋已经发展了几个世纪,如果没有相关经验,盲目修改游戏规则对整个棋局的影响是很难预测的。AlphaZero提供了一种替代性的计算手段来评估棋局的公平性。它可以不断从自身获得的经验中学习,不需要任何人类监督,就能对任何规则改动进行评估进而得到近乎最优的策略。在本研究中,作者使用AlphaZero来创造性地探索和设计新的国际象棋规则。目前人们对费舍尔随机棋(Fischer Random Chess)越来越感兴趣,因为其涵盖了经典国际象棋的大量开局理论、职业比赛中高比例的平局的特点,此外还需要双方棋手在开战前进行大量的练习。作者比较了另外9种国际象棋的变体棋种,这些规则的变化可以激发出很多新的战略和战术模式,同时还能使对局接近于原来的水平。通过使用AlphaZero学习每个棋种变体的最佳策略,我们就可以清楚,如果采用这些变体,人类高手之间的对局会是什么样子。从定性上看,这些棋种变体具有动态的特点。分析表明,相同棋子在不同棋种变体中的重要性不同,一些棋种变体比经典的国际象棋在整体棋局中表现出了更强的决胜性。该发现证明了现代国际象棋有更多规则变化的可能性。
2
规则一直是活的
流行的游戏往往会随着时间的推移而不断发展,现代国际象棋也不例外。最初的国际象棋游戏起源于6世纪的印度,然后传到波斯和穆斯林世界,后来传到欧洲和全球。在中世纪,欧洲国际象棋主要还是以沙特兰兹为基础,这是一种起源于萨珊帝国的早期变体,是以印度的Chaturanga为基础的,在这种变体中,皇后和主教的走法受到更多限制,棋子的威力也不如现代国际象棋,城堡当时还不存在。除了将军以外,还可以通过暴露对方的国王来取胜,即吃掉对方所有其他棋子。在沙特兰兹中,僵局被认为是胜利,而现在则被认为是平局。几个世纪以来国际象棋的演变可以看作是搜索空间复杂性的变化和游戏最终结果的不确定性变化,现代规则比较重视后者,认为这是国际象棋游戏体验的重要因素。人们对国际象棋进一步发展的兴趣并没有消退,特别是近来职业比赛中决定性的对局越来越少,选手们对于经典象棋的理论越来越依赖,再加上人们对象棋千变万化的玩法的好奇心和不断探索的欲望,产生了许多国际象棋的变体。这些变体涉及对棋盘、棋子位置或整体规则的改变,为棋手提供了"一些在普通国际象棋中无法体会到的微妙的有趣的东西"。目前最著名和最流行的国际象棋变体可能是Chess960或费舍尔随机棋,其中第一横排的棋子是从960种随机排列中选取的,这使得前期的理论准备变得不可行。 国际象棋和人工智能有着千丝万缕的联系。图灵(1953年)提出:"能不能制造一台机器来下棋,并逐渐改进它的下法,人们再从它的经验中获取技巧?"虽然计算机国际象棋自20世纪50年代以来稳步发展,但图灵问题的第二部分直到最近才完全实现,即AlphaZero的诞生。它的出现又催生了新的项目,如Leela Chess Zero和对现有国际象棋引擎的改进。CrazyAra采用了相关的方法来对Crazyhouse(也是一种国际象棋变体)进行了实验,不过它需要从现有的人类游戏数据进行预训练。原始AlphaZero系统的一些特性被证明可以泛化到Atari等领域,即使在没有精确环境模拟器的情况下也能保持其在国际象棋上的性能。AlphaZero还显示出超越游戏环境的能力,最近有研究表明可以将该模型应用在量子动力学的全局优化中。在任何游戏上训练AlphaZero时,并不需要事先的游戏知识。因此,我们可以快速探索不同的规则集,并通过定量和定性的比较来确定所产生的游戏风格。这篇文章中,作者以AlphaZero的视角来研究国际象棋规则的几种假设性变体,进而推测出国际象棋界可能感兴趣的棋种变体。作者用AlphaZero研究了被Vladimir Kramnik公开倡导的No-castling变体,其出现在了2019年12月19日的职业比赛中。当时Luke McShane和Gawain Jones在伦敦国际象棋精英赛期间进行了有史以来第一场特级大师的No-castling比赛。此后,2020年1月在印度金奈举办了第一届No-castling国际象棋比赛,出现了89%的决胜局。
3
规则变更示例
更改国际象棋的规则有多种方式,在这项工作中,作者限于考虑原子级变化,以使游戏尽可能接近经典的国际象棋。在某些情况下,需要对50步规则进行更改,以避免出现游戏无法结束的情况。这是为了保留原始游戏的对称性和美学吸引力,同时希望通过新的开局、中局或尾局模式以及新颖的开局理论来发现动态的变体。考虑到这一点,作者没有考虑任何涉及棋盘本身、棋子数或棋子布局的更改。表1列出了作者研究的规则变更。目前还没有进行严格的审查,将僵局视为胜利在国际象棋界是一个悬而未决的问题。表1中列出的每个规则更改都可能以期望或不期望的方式影响游戏。例如,考虑No-castling变体(不允许使用城堡)。不使用城堡的一个可能结果是,如果国王在比赛中暴露更多,并且需要时间来确保国王的安全,那将导致游戏风格更倾向于进攻。然而,由于防御方也有反击的机会,因此无法轻易保护自己的国王可能使攻击成为糟糕的选择。在经典象棋中,玩家通常在发动攻击之前先进行防御。因此,这种改变可能导致比赛变得无趣,以及游戏方式变得更加受限。按照传统,评估规则的唯一方法是让大量的人类玩家长时间玩游戏,直到积累了足够的经验和理解为止。这不仅是一个漫长的过程,而且还需要大量玩家的支持。借助AlphaZero,可以自动化这一过程,并在一天内模拟相当于几十年的人类游戏,从而使我们能够通过计算机测试这些假设,并观察游戏中每个已考虑变化的新兴模式和理论。
道翰天琼认知智能未来机器人接口API简介介绍
- 认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的深度理解为突破口,以跨学科理论体系为指导,从而形成的新一代理论、技术及应用系统的技术科学。 认知智能的核心研究范畴包括:1.宇宙、信息、大脑三者关系;2.人类大脑结构、功能、机制;3.哲学体系、文科体系、理科体系;4.认知融通、智慧融通、双脑(人脑和电脑)融通等核心体系。 认知智能四步走:1.认知宇宙世界。支撑理论体系有三体(宇宙、信息、大脑)论、易道论、存在论、本体论、认知论、融智学、HNC 等理论体系;2.清楚人脑结构、功能、机制。支撑学科有脑科学、心理学、逻辑学、情感学、生物学、化学等学科。3.清楚信息内涵规律规则。支撑学科有符号学、语言学、认知语言学、形式语言学等学科。4.系统落地能力。支撑学科有计算机科学、数学等学科。
认知智能CI机器人是杭州道翰天琼智能科技有限公司旗下产品。认知智能机器人是依托道翰天琼10年研发的认知智能CI体系为核心而打造的认知智能机器人大脑,是全球第一个认知智能机器人大脑。具有突破性,创新性,领航性。是新一代智能认知智能的最好的产品支撑。 认知智能机器人技术体系更加先进,更加智能,是新一代智能,认知智能领域世界范围内唯一的认知智能机器人。 认知智能机器人是新时代的产物,是新一代智能认知智能的产物。代表了新一代智能认知智能最核心的优势。和人工智能机器人大脑相比,优势非常明显。智能度高,客户粘性大,客户满意度高,易于推广和传播等核心特点。 依托认知智能机器人平台提供的机器人大脑服务,可以赋能各个行业,各个领域的智能设备,各类需要人机互动的领域等。认知智能机器人平台网址:www.weilaitec.com,www.citec.top。欢迎注册使用,走进更智能机器人世界。
认知智能和人工智能的优劣势对比主要可以分为四大方面: 第一:时代发展不同。人工智能是智能时代发展的第二个阶段,认知智能是智能时代发展的第三个阶段。时代发展上决定了认知智能更显具有时代领先性。 第二:基础理论体系不同。人工智能的基础理论体系以数学为基础,以统计概率体系为基础。认知智能基础理论体系以交叉许可理论体系为基础。包含古今中外哲学体系,心理学体系,逻辑学体系,语言学体系,符号学体系,数学体系等学科。其基础理论体系更加具有创新性,突破性和领先性。且交叉学科理论体系的研究也是未来智能发展的大方向。其具体理论体系,还包含三体论(宇宙,信息,大脑三者关系),融智学,和HNC等。 第三:技术体系不同。人工智能的核心技术体系主要是算法,机器学习,深度学习,知识图谱等。其主要功用在感知智能。感知智能其核心主要是在模仿人类的感知能力。认知智能的核心技术体系是以交叉学科理论体系而衍生出来的。具体包含三大核心技术体系,认知维度,类脑模型和万维图谱。认知智能的技术体系核心以类脑的认知体系为基础。以全方位模仿类脑能力为目标。人工智能以感知智能为基础的体系,只能作为认知智能中的类脑模型技术体系中的感知层技术体系。类脑模型大致包含,感知层,记忆层,学习层,理解层,认知层,逻辑层,情感层,沟通层,意识层等9大核心技术层。因此人工智能的核心只是作为认知智能类脑模型中的感知层。因此在技术体系上,人工智能和认知智能基本上没有太多的可比性。 第四:智能度成本等方面的不同:人工智能产品的综合智能程度,普遍在2-3岁左右的智力水平。认知智能产品其智能程度大致在5-8岁左右。认知智能体系构建的机器人更加智能。且更省时间,更省人力和资金。优势非常多。具体请看下列的逐项对比。
Deep Mind用AlphaZero开发国际象棋新规则-3!相关推荐
- 超越AlphaZero,DeepMind新算法MuZero登顶Nature | AI日报
超越AlphaZero,DeepMind新算法MuZero登顶Nature 2016年,DeepMind 推出了第一个人工智能程序 AlphaGo,在围棋游戏中击败人类.两年后,它的继任者AlphaZ ...
- 《数据科学家修炼之道》一2.2 新规则
本节书摘来异步社区<数据科学家修炼之道>一书中的第2章,第2.2节,作者: [美]Zacharias Voulgaris(弗格里斯)译者: 吴文磊 , 田原 责编: 陈冀康,更多章节内容可 ...
- BCH网络升级顺利完成,将创新和开发推向新高度
在UTC时间2019年11月15日,区块高度609135处BCH网络按计划进行了升级.该区块由AntPool矿池打包,包含306笔交易,总大小90.90 kb.升级新共识之后的BCH,从第一个区块60 ...
- 数睿数据深度 | 企业级无代码开发 新思路 新模式 新动能
企业级无代码开发 新思路 新模式 新动能 在9月29日由LowCode低码时代主办的"低代码技术发展与应用线上研讨会"上,南京数睿数据CTO张超以<企业级无代码开发 新思路 ...
- 原创 | 浅议个人数据开发利用新范式
在所有数据资产类型中,个人数据的开发利用潜在价值巨大.个人数据在过去几十年里,已经得到前所未有的开发和利用,推动了经济增长和社会发展.但与此同时,也逐渐引发越来越凸出的经济.社会和伦理道德问题. Ap ...
- 2018python培训-2018年5月python自动化运维开发课程新班正式开课!
2018年5月python自动化运维开发课程新班正式开课! 作者: 更新时间::2018-05-16 新推出的ansible是新出现的 自动化 运维工具 , 基于Python研发 . 糅合了众多老牌运 ...
- 欧盟数据保护新规则 75%云应用没准备好
欧盟发布了一项新的通用数据保护规则( General Data Protection Regulation,GDPR),该规则对欧洲云应用提出了更为严格的规则.而一家调查机构发现,约75%的云应用并未 ...
- CIA公布了收集和存储美国公民信息的新规则
本文讲的是CIA公布了收集和存储美国公民信息的新规则, 美国中央情报局( CIA )昨天首次公布了收集.分析和存储美国公民信息的最新规则. 据中央情报局总顾问卡罗琳 (Caroline Krass)表 ...
- 滴滴新规则明日起试行:将影响一大波人
今日,滴滴出行宣布,经过一周时间的公示及征求意见,滴滴将于8月22日起正式实施未成年人乘车新规则,允许16岁至18岁的未成年人单独乘坐网约车.今后这部分未成年人在乘车前必须设置紧急联系人,平台将通过& ...
- Cognos开发自定义排序规则的报表和自定义排名报表
Cognos开发自定义排序规则的报表和自定义排名报表 场景:有一个简单的销售数据分析,可以按照日期,按照商品类型来分析订单笔数和订单金额. 目的:用户可以自定义查看按照不同指标排序的数据,用户可以查看 ...
最新文章
- 迭代3:UC1,UC2的2.1 业务建模 2.2 UC2用例模型 2.3 UC2补充性规格说明
- MATLAB遍历子文件夹及其下文件
- 转 詹宏志谈数字出版
- show profile 分析SQL
- Ehcache存储策略总结
- wxWidgets:wxModule类用法
- u盘启动 联想一体机_关于联想扬天B41-30-NTZ(L)使用U盘重装Win10系统的详细步骤
- [读书笔记]鸟哥的LINUX私房菜 十三章 shell scripts
- [弹性力学]弹力与材力的同一变量的规定正方向的不同导致公式中个别符号不同
- Python GUI设计 PythonWx
- 电脑ip地址设置_关于路由器动态IP如何设置教程
- ligerui+json_002_Grid用法、属性总结
- Julia :关于函数返回类型::
- 高速公路坐标高程计算软件3.5发布
- GALGAME文字提取agth 特殊码大全(特殊码表)和使用方法
- 第7周 文件和数据格式化
- DIY个性家装心得家用电动工具选择
- 数字转成人民币汉字大写(李刚著《疯狂Python讲义》P87,解决小数部分及多个零的问题。学习笔记)
- Anomaly Detection with partially Observed Anomalies论文笔记
- 差分数组(简单易懂)
热门文章
- 16年,平凡而又收获的一年,android底层开发实战
- android8.0的电池图标,Android 8.0 电池图标 显示分析
- 得物(毒)加密算法解析 得物逆向
- 即使被拖库,也可以保证密码不泄露(一种安全的加密方案)
- “用户体验及可用性测试”前三章:读书笔记
- C语言中的指针加减偏移量
- (SCI论文写作)三种高效的论文用公式编辑器推荐(Word、mathtype、亿图公式编辑器)
- 社会学概论试题库【1】
- Sharepoint 列表关联Title字段设置
- ni visa pci_VISA/MASTER信用卡在线缴费友邦、保诚步骤!