百度开发的围棋程序Bingo,由自然语言处理部门来进行。实际上,这可能是机器学习的一次小胜利。

Link:百度杨程:人工智能让系统懂得“学习”-IT168 软件专区

在原文中,关于算法的解释是这样的。

进入21世纪,基于蒙特卡洛树状搜索的UCT算法一直被业界视为解决计算机为其问题的关键,但UCT算法同样存在着取样量巨大、运行缓慢的致命问题。在UCT算法的基础上,杨程老师及其团队进行了大量的优化改进,最终提出了全新的学习算法,并成功应用于Bingo系统中。在相同时间内,新算法可以产生比UCT多若干倍的统计值,这可以大大加快Bingo的在线学习速度;其次,杨程和他的团队还定义了一种弱化形式的Alpha-Beta搜索,将其与在线强化学习和离线监督学习结合起来,并成功地嵌入到蒙特卡洛搜索当中,这使得探索更加深入地往极具前景的方向发展。“因为统计值多了,所以Bingo学习很快,而且基本上成功地实现了Rapid Action…可能的胜率在百分之七八十左右。”在谈到新算法带来的改进时,杨程说。

网络上关于这一段的资料不多,然而,从这一段中就可以略微的猜出其使用的算法了。百度抛弃了已经逐渐没落的UCT,一个很重要的原因可能是UCT的学习能力的确太慢。UCT实质上是一种在运算中不断学习的算法,从开始游戏到终止游戏都在不停的进行学习。然而,其学习的方法单一,在围棋这样项目上,学习效率不足也是致命的。百度使用的弱化的Alpha-Beta搜索,应该是在对蒙特卡罗模拟过程中,基于Alpha-Beta原理对大量表现不怎么好的节点进行快速的剪枝,这可能是基于一个由大量的离线学习而得到的剪枝函数。其主要使用的算法应该是一定的UCT+RAVE(Rapid Action Value Estimate)的变种算法,可以进行在线强化学习。同时,他在蒙特卡罗模拟过程,嵌入了一个由离线监督学习提炼出来的函数(通过大量的对比棋谱进行学习)。这个函数目的是快速的洗刷掉那些下的比较“掉价”的分支,减少整个博弈树节点的数量,也快速的提升了算法性能。所以,这是一种在线学习(UCT和RAVE结合)以及离线学习(蒙特卡罗模拟阶段清洗用的函数)的结合。

更期待百度可以把相关的技术发表出来。毕竟基于有限的信息,这猜测很可能会产生巨大的偏离。

对百度Bingo算法的猜测相关推荐

  1. 【摘抄】百度分词算法详解:查询处理以及分词技术

    随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能.技术和日流量.作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等:作为 普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引 ...

  2. 百度细雨算法,旨在提升用户浏览B2B信息体验

    百度搜索推出细雨算法,命中算法的站点将会受到限制展现的处罚."细雨算法"主要针对B2B分类信息网.黄页分类需求信息网."细雨算法"与"飙风算法&quo ...

  3. 16分钟优化mRNA疫苗稳定性! 百度AI算法LinearDesign问世

    新冠病毒全球累计确诊已超过400万人,疫苗是终结疫情的关键胜负手.在所有正在研发的疫苗路径中,研发速度更快.更具潜力的mRNA疫苗作为一种新兴技术受到了国内外的重点关注.但同时,mRNA疫苗由于稳定性 ...

  4. 搜索引擎设计实用教程(3)-以百度为例 之三:对百度分词算法的进一步分析

    中科院软件所 2005年11月 上面说过,经过分析得出百度的分词系统采用双向最大匹配分词,但是后来发现推理过程中存在一个漏洞,而且推导出来的百度分词算法步骤还是过于繁琐,所以进一步进行分析,看看是否前 ...

  5. 16 分钟优化 mRNA 疫苗稳定性!百度 AI 算法 LinearDesign 为新冠疫苗研发提速

    新冠病毒全球累计确诊已超过400万人,疫苗是终结疫情的关键胜负手.在所有正在研发的疫苗路径中,研发速度更快.更具潜力的mRNA疫苗作为一种新兴技术受到了国内外的重点关注.但同时,mRNA疫苗由于稳定性 ...

  6. python数据结构与算法分析 第2版_题库 | 百度数据结构 / 算法面试题型介绍及解析 第 2 期...

    题目1:分解成质因数 (如 435234=251*17*17*3*2) void prim(int m, int n){ if(m>n){ while(m%n != 0) n++; m /= n ...

  7. 免费网站采集程序怎么规避百度飓风算法

    网站采集主要是用于提升网站文章被收录,从而获得流量.很多人都在担心一个点,百度飓风算法对于采集站的打击力度也是越来越强了,采集站真的生存不了吗?很多同行网站每天发布几百的文章数据,真的是编辑人员写的吗 ...

  8. 百度seo算法_SEO秘诀:Google的逆向工程算法

    百度seo算法 by benjamin bannister 通过本杰明·班尼斯特 SEO秘诀:Google的逆向工程算法 (SEO Secrets: Reverse-Engineering Googl ...

  9. 百度闪电算法实时解读

    笔者不止一次提到过,网站加载速度也是衡量网站seo优化效果的维度之一.近期,百度出台闪电算法,通过官方的形式进一步验证了笔者的观点.如何正确解读这个算法,这个算法对于站长来讲又有哪些操作点,实施解读如 ...

最新文章

  1. DbHelper数据操作类,DbProviderFactories
  2. Python 标准化 - 使用logging
  3. OpenInventor开发笔记:解决FaceSet的填充问题
  4. Python编程学习:让函数更加灵活的*args和**kwargs(设计不同数量参数的函数)的简介、使用方法、经典案例之详细攻略
  5. 生吃蔬菜健康轻松瘦身 - 健康程序员,至尚生活!
  6. 《c语言从入门到精通》看书笔记——第2章 算法
  7. 实验11 编写子程序
  8. 关于算法--分治法--合并排序
  9. [Melodymood][流行经典]Take Me to your heart 《吻别》英文版
  10. vue一个页面用两个以上页面 时时刷新
  11. python操作之更新数据库中某个字段的数据
  12. BSC(币安智能链)主网链部署
  13. openwrt的源码下载及其编译 (一)
  14. mysql联合查询 课程表_oracle 学生表,课程表,选课表. 三表联合查询
  15. ppt如何替换其他mo ban_有没有一个 PPT 技巧让自己觉得人生都亮了?
  16. 练T25- focus必看!所有成功截图汇总
  17. 基于解决sci和ei等外文思维顺序问题的辅助软件分析
  18. MT6261芯片处理器性能特点资料介绍
  19. AVR单片机开发2——流水灯及仿真
  20. rstudio运行python_RStudio网状Python

热门文章

  1. 阿里云云计算ACP学习(九)---阿里云安全
  2. CS5216DP转HDMI1080P方案|CS5216:DP++to HDMI(1080P)
  3. OpenCV:vector subscript out of range
  4. PAT练习 蜜蜂寻路
  5. 网络安全学习第15篇 - 游戏内存修改
  6. 多彩M618XSD垂直立式人体工学鼠标拆解
  7. 憨批的语义分割重制版2——语义分割评价指标mIOU的计算
  8. 用计算机画对称图形,人教小学美术五下《第17课电脑美术 对称图形》word教案...
  9. React 父子组件的生命周期关系(16.4版本及以后)
  10. mpls 笔记 part 1