202000 - AlphaGo如何进化为孤独求败?
独孤求败,金庸笔下功高盖世的武林前辈,江湖虽没有他的身影,却处处有他的传说。其墓碑前刻有:“纵横江湖三十余载,败尽英雄,天下更无敌手,无可奈何隐居深谷,呜呼哀哉,生平难求一敌手!”[1]
剑的江湖,有孤独求败!
围棋的江湖,也有孤独求败,正是AlphaGo.
初出茅庐
2015/10, 谷歌开发的名为“阿尔法围棋”(AlphaGo)的AI机器人横空出世[2],AlphaGo-Fan以5:0完胜欧洲围棋冠军、职业二段选手樊麾。
一鸣惊人:大哥 - AlphaGo-Lee
2016/3/9-15,在韩国首尔,AlphaGo-Lee以4:1战胜世界围棋冠军李世石。
无人能敌:二哥 - AlphaGo-Master
2017/5/23-27, 在中国乌镇围棋峰会上,AlphaGo-Master以3:0战胜世界第一的围棋冠军柯洁。
孤独求败:终结者 - AlphaGo Zero[3]
2017/10/19,DeepMind(谷歌旗下公司,AlphaGo出生地)在《Nature》杂志上发表论文,报告新版AlphaGo Zero,抛弃人类经验,从零开始,自学围棋,3天战胜了大哥哥AlphaGo-Lee;21天后,又战胜了二哥AlphaGo-Master;40天后,已经妥妥地称霸天下,孤独求败。
AlphaGo Zero放弃了之前基于人类经验的“监督学习”思路,而是改用了“强化学习”+“监督学习”的思路。
大量的人类棋局作为数据输入的思路被摈弃,开发者只是告诉AlphaGoZero围棋的规则,然后让双胞胎兄弟互相切磋,从零开始,自学成才。
每秒可以下8万步,一盘棋400步不到,每秒就下了200盘。
每盘棋后长进一点,到7个小时,也就相当于下了500万盘棋后,就已经有模有样了。
一天半后,也就是下了2600万盘后,已经可以战胜大哥AlphaGo-Lee了。
三天后,100:0直接将大哥打趴。
后面的事情就是超越二哥,并且难求一败了。
AlphaGo在没有人类对手后,2017年5月25日,AlphaGo之父杰米斯·哈萨比斯宣布AlphaGo退役。
AlphaGo的研究计划于2014年开始,从业余棋手的水平到世界第一,AlphaGo的棋力获取这样的进步,仅仅花了两年左右。
AlphaGo虽已退休,但技术永存。
“强化学习”势必会为人类带来更多的借鉴与思考。
链接: [1] 独孤求败 词条(https://baike.baidu.com/item/%E7%8B%AC%E5%AD%A4%E6%B1%82%E8%B4%A5/24317?fr=aladdin).
[2] AlphaGo 词条(https://baike.baidu.com/item/%E9%98%BF%E5%B0%94%E6%B3%95%E5%9B%B4%E6%A3%8B/19319610?)
[3] AlphaGo Zero横空出世 完全自学21天虐Master (http://sports.sina.com.cn/go/2017-10-19/doc-ifymzqpq2269773.shtml)
202000 - AlphaGo如何进化为孤独求败?相关推荐
- 荣耀A55高调上市仅仅为孤独求败?
坦白说.华为近年来在手机市场上确实取得了一些成绩.比方之前P6的出现就凭借超薄的设计.突出的性价比让大家看到了国产手机的新希望.按理说.在手机市场上尝到甜头的华为应该继续坚持低价.亲民的路线,但此次为 ...
- 孤独求败张小龙,今日决战光明顶。
前两天微信微信的日登录量超过10亿,这是中国第一款App能够到达如此的境界.并且我们拿着微信在江湖上百步之内,找不到任何对手,于是张小龙就像一个武林绝学高手一样,孤独的为大家讲了4个小时候的微信产品观 ...
- 用AlphaGo设计材料合成实验
来源:曾林的科学网博客 AlphaGo下围棋连挫顶尖高手最终孤独求败的故事几乎家喻户晓.这也引发了大家对人工智能的能力的广泛思考.在科学研究领域,比如说合成实验设计,传统的做法不外乎是依靠经验不断的尝 ...
- 计算机下棋简史|AlphaZero完爆世界棋类冠军背后
Play is the beginning of knowledge. 游戏是知识之源. --George Dorsey(多尔西) - because chess requires intellige ...
- 云栖科技评论第23期:CES2017年度最佳榜单出炉 看“黑科技”如何入围
1.CES 2017年度最佳榜单出炉:看"黑科技"如何成功入围 CES 2017年度最佳榜单出炉:看"黑科技"如何成功入围 [新闻摘要]国际消费类电子产品展览会 ...
- 竞品还在追赶 OpenAI用GPT-4飚赢自己
赶在百度"文心一言"发布前一天,OpenAI祭出了GPT-4,这对于百度.谷歌们来说,可能是一个重大打击. 人们已经领略过GPT-3.5加持下的ChatGPT,但GPT-4比&qu ...
- 机器下棋史:人造的智能,战胜了造智能的人
大家好,我是为人造的智能操碎了心的智能禅师. 今天带来的文章,来自一本书,叫做<人工智能简史>. 文章比较长,禅师就不多说什么了.提醒大家今天次条由禅师的私人助理条子,给大家送了一份福利, ...
- 30岁之前必须明白的道理(你现在知道此生无憾了)
越有本事的男人越没脾气. 世界上只有骗子是真心的.因为他是真心骗你的! 一个女人可以不美貌,但一定要瘦,一起来瘦吧 幸好爱情不是一切, 幸好一切都不是爱情. 一句"我难受" .可以 ...
- HighNewTech:动图看1997~2019年《世界最有价值公司Top10排名》的变迁史——《Most Valuable Companies In The World》
High&NewTech:动图看1997~2019年<世界最有价值公司Top10排名>的变迁史--<Most Valuable Companies In The World& ...
- 从零开始学 Java - Spring MVC 统一异常处理
看到 Exception 这个单词都心慌 如果有一天你发现好久没有看到Exception这个单词了,那你会不会想念她?我是不会的.她如女孩一样的令人心动又心慌,又或者你已经练功到了孤独求败,等了半辈子 ...
最新文章
- JPA 复杂查询 - Querydsl
- Scriptaculous创始人作序推荐——《Ajax实战:Prototype与Scriptaculous篇》
- 不懂编程可以自学python吗-会Python的人工作不会太差?编程课真的有必要学吗?...
- cpp 一个文件分成两个文件写_为ORB-SLAM2写一个launch文件
- 微型计算机机房湿度不宜过大对,2013年计算机等考三级PC技术练习题及答案(1)...
- linux java运行环境_linux(centos)中java运行环境_jdk安装与配置 | OPS技术联盟
- 关于proc的介绍,比较详细
- 弹窗修改数据 临时解决方法 + ajax
- c++语言函数参数传递方式,C++函数传递三种方式解读
- 自学-Linux-老男孩Linux77期-day7
- TCP 报文段之首部格式
- 【专题6: 其他知识】 之 【2.1.关于择业和就业_嵌入式学习路线和方法】
- python获取图像灰度极值点_【图像处理】灰度图、亮度峰值极值查找
- 看板 工具_2019年14种最佳看板工具
- 程序人生:我相信每个软件测试工程师都有一份跟我差不多的心酸历程?
- 推荐系统三十六式——学习笔记(三)
- Unity中根据设备名称获取串口号
- ShowMeAI —— Show u 三连
- Linux教程【一】
- 全球各国城镇人口数量(1960-2019年)
热门文章
- ORB-SLAM2安装以及遇到问题
- TrueType字体变成宋体的方法
- (default-compile) on project datasource-demo: Fatal error compiling
- 应用泛函分析—距离空间
- 网站弹窗广告html,网站弹窗广告(彻底关闭浏览器的广告弹窗?)
- 国内计算机三大期刊+ JCST
- Android开发前景及现状分析
- 谈谈Linux应用程序 ABI兼容性
- 虚拟机ubuntu左侧和上方工具栏消失
- 微软内存测试软件,内存检测工具Microsoft Windows Memory Diagnostic是用说明