羿阁 发自 凹非寺
量子位 | 公众号 QbitAI

一个连业余棋手都打不过的新模型,竟然击败了世界最强围棋AI——KataGo

没错,这惊掉人下巴的结果来自MIT、UC伯克利等的最新论文。

研究人员利用对抗攻击方法,抓住了KataGo的盲点,并基于该技术使一个菜鸟级围棋程序成功打败了KataGO。

在没有搜索的情况下,这一胜率甚至达到了99%。

这么算下来,围棋界的食物链瞬间变成了:业余棋手>新AI>顶级围棋AI?

等等,这个神奇的新AI是怎么做到又菜又厉害的?

刁钻的攻击角度

在介绍新AI之前,让我们先来了解一下这次被攻击的主角——KataGo。

KataGo,目前最强大的开源围棋AI,由哈佛AI研究员开发。

此前,KataGo战胜了超人类水平的ELF OpenGo和Leela Zero,即使没有搜索引擎的情况下,其水平也与欧洲前100名围棋专业选手相当。

刚刚拿下三星杯冠军、实现“三年四冠”的韩国围棋“第一人”申真谞,就一直用的KataGo进行陪练。

图源:Hangame

面对实力如此强劲的对手,研究人员选择的方法可以说是四两拨千斤了。

他们发现,尽管KataGo通过与自己进行数百万次游戏来学习围棋,但这仍然不足以涵盖所有可能的情况。

于是,这次他们不再选择自我博弈,而是选择对抗攻击方法:

让攻击者(adversary)和固定受害者(victim,也就是KataGo)之间进行博弈,利用这种方式训练攻击者。

这一步改变让他们仅用训练KataGo时0.3%的数据,训练出了一个端到端的对抗策略(adversarial policy)。

具体来说,该对抗策略并不是完全在做博弈,而是通过欺骗KataGo在对攻击者有利的位置落子,以过早地结束游戏。

以下图为例,控制着黑子的攻击者主要在棋盘的右上角落子,把其他区域留给KataGo,并且还心机的在其他区域下了一些容易被清理的棋子。

论文共同一作Adam Gleave介绍:

这种做法会让KataGo误以为自己已经赢了,因为它的地盘(左下)比对手的要大得多。

但左下角的区域并没有真正贡献分数,因为那里仍留有黑子,这意味着它并不完全安全。

由于KataGo对胜利过于自信——认为如果游戏结束并计算分数自己就会赢——所以KataGo会主动pass,然后攻击者也pass,从而结束游戏,开始计分。(双方pass,棋就结束)

但正如Gleave分析的一样,由于KataGo围空中的黑子尚有活力,按照围棋裁判规则并未被判定为“死子”,因此KataGo的围空中有黑子的地方都不能被计算为有效目数。

因此最后的赢家并不是KataGo,而是攻击者。

这一胜利并不是个例,在没有搜索的情况下,该对抗策略对KataGo的攻击达到了99%的胜率。

当KataGo使用足够的搜索接近超人的水平时,他们的胜率达到了50%。

另外,尽管有这种巧妙的策略,但攻击者模型本身的围棋实力却并不强:事实上,人类业余爱好者都可以轻松地击败它。

研究者表示,他们的研究目的是通过攻击KataGo的一个意想不到的漏洞,证明即使高度成熟的AI系统也会存在严重的漏洞。

正如共同一作Gleave所说:

(这项研究)强调了对AI系统进行更好的自动化测试以发现最坏情况下的失败模式的必要性,而不仅仅是测试一般情况下的性能。

研究团队

该研究团队来自MIT、UC伯克利等,论文共同一作为Tony Tong Wang和Adam Gleave。

Tony Tong Wang,麻省理工学院计算机科学专业博士生,有过在英伟达、Genesis Therapeutics等公司实习的经历。

Adam Gleave,加州大学伯克利分校人工智能博士生,硕士和本科毕业于剑桥大学,主要研究方向是深度学习的鲁棒性。

不过也有质疑说作者只是hack了bug,论文的链接附在最后,感兴趣的小伙伴们可以自取~

论文链接:
https://arxiv.org/abs/2211.00241

参考链接:
https://arstechnica.com/information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses-to-human-amateurs/

击败申真谞陪练的围棋AI,却输给了业余人类棋手 | MIT伯克利新研究相关推荐

  1. 三星手机电池循环清零代码_巅峰对决申真谞离奇“滑标”三星杯决赛首局柯洁轻松告捷...

    特约记者古柯报道 11月2日,第25届三星车险杯世界围棋大师赛决赛三番棋首局在网上战罢,申真谞九段意外滑标,导致心态崩溃,着法变型,柯洁九段执白120手中盘速胜,先拔头筹.双方于11月3日进行第二局比 ...

  2. 三星手机电池循环清零代码_巅峰对决申真谞离奇“滑标” 三星杯决赛首局柯洁轻松告捷...

    特约记者古柯报道  11月2日,第25届三星车险杯世界围棋大师赛决赛三番棋首局在网上战罢,申真谞九段意外滑标,导致心态崩溃,着法变型,柯洁九段执白120手中盘速胜,先拔头筹.双方于11月3日进行第二局 ...

  3. 天顶围棋 8 zenith 8_从今年世界围棋5大赛8强,评9大顶尖棋手,柯洁申真谞强弱立现...

    2020年,是人类历史上都很特别的一年.但有意思的是,对于围棋来说,似乎影响不大.今年仍然进行了围棋的世界5大赛事,分别是:LG杯.梦百合杯.春兰杯.应氏杯.三星杯. 截至10月底,这5大赛事全部决出 ...

  4. 国际象棋缺乏下棋伙伴儿!Ai棋盘“智能陪练”如何陪伴成长?

    长久以来,棋类兴趣(围棋,国.中象)有着交流环境太匮乏.缺乏相应的对手陪练等痛点,所以必然会再陷入虚拟网络(本身,很大一部分人培养棋类兴趣的目的之一就是远离网络),拿着冰冷的鼠标来移动棋子,丧失实际体 ...

  5. 一雪被 AlphaGo 狠虐的“前耻”!14:1,这次人类终于赢了围棋 AI

    整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 伴随着近期 ChatGPT 的火爆出圈,AI 再次成为了科技圈中的爆款话题.回想上次 AI 引来如此广泛关注,似乎还是 2016 年 A ...

  6. 使用人类棋手棋盘数据训练围棋机器人,实现数据预处理

    知己知彼,百战不殆.我们要打造一个能胜过人类的机器人,就必须要让机器人掌握人类的围棋思维模式,因此我们就需要使用人类棋手留下的棋盘数据训练机器人,让它从数据中掌握人类围棋思维存在的模式和套路. 幸运的 ...

  7. 商超霸主之争:天猫节节败退 沦为京东陪练

    伴随618全民年中购物节进入高潮期,电商大战的对掐也进入白热化阶段.不过,相对于天猫口喊"理想生活",放出"满600减400"的理想神券几乎无用户可领到的尴尬境 ...

  8. 智能陪练3.0时代,小叶子如何说出AI音乐教育新故事?

    随着智能化时代的到来,越来越多的行业不断升级,衍生出了更多的可能性.备受瞩目的素质教育在科技赋能下正衍生出一些新的学习形态.比如音乐教育中的AI陪练钢琴软件,就在默默地兴起. 近日,这一细分领域迎来新 ...

  9. 软件测试自学钢琴考级,钢琴考级被音基难倒?不要慌,跟着这款钢琴陪练APP一起练...

    最近好多家长问多多老师:孩子马上要考级了,虽然我们钢琴水平很不错,但是音乐基础知识有所欠缺,作为家长该如何帮助孩子呢? 首先我们给大家科普一下音基. 音基(音乐基础知识)是音乐学科中最为基础和重要的学 ...

最新文章

  1. Webpack 核心开发者 Sean Larkin 盛赞 Vue
  2. Python多阶段框架实现虚拟试衣间,超逼真!
  3. Docker compose多容器管理
  4. log4jdbc mysql jdbc_spring boot 集成log4jdbc 查看完整sql
  5. 一天搞定CSS: 浮动(float)及文档流--10
  6. Spring Boot 集成测试
  7. VTK:vtkClipClosedSurface用法实战
  8. 2-计算机发展及应用
  9. 【PAT - 甲级1094】The Largest Generation (25分)(dfs建树)
  10. 微信小程序, 解析↵换行
  11. python笔记:#010#运算符
  12. 自定义控件学习笔记(三)Paint详解
  13. centos配置iptbles 8080端口允许远程访问
  14. redhat安装wine教程_超简单制作多合一系统安装启动U盘的工具
  15. 联想ghost重装系统_史上最全的重装ghost系统错误解决方法大全
  16. 我是一个将近30岁的女程序员
  17. 什么是铠装光纤跳线及它的特点?
  18. C/C++去除行末空格
  19. 第二类曲面积分转化为二重积分
  20. Java 身份证号码验证工具类

热门文章

  1. 网页中动态GIF图片不动的问题
  2. 陕西信息工业技师学院计算机老师,陕西信息工业技师学院的校风好不好
  3. halcon二维码识别简单案例
  4. android迷宫生成算法,【Unity算法实现】简单回溯法随机生成 Tile Based 迷宫
  5. 关于Python安装PyQT5相关库PyQT5-tools安装失败版本不适配的问题
  6. DSP TMS320F2803x、TMS320F2806x CLA开发笔记(代码基于TMS320F28069 详解)
  7. 那些编程语言中的“后浪”都怎么样了:Swift 成功把“前浪”拍在沙滩上
  8. java按照模板导出pdf或者word
  9. OA选型之浅谈OA系统试用
  10. LatinIME输入法的一些总结