1 背景

有道纵横是网易有道旗下专为4-8岁孩子量身打造的在线少儿围棋产品,于2019年启动,自研了全国首部在线交互式围棋动漫课程,从孩子的理解力和喜好出发,采用直播互动的课程形式将围棋知识变得简单有趣、易懂好学,帮助孩子掌握围棋的各类规则和技巧。不仅如此,课后还设有AI对弈功能,能够智能识别孩子的段位水平匹配对局练习,从根源培养孩子的思维习惯。每局对弈结束后的智能分析,会从大局观、计算力、稳定性、战斗和棋型五方面进行全方位分析,帮助孩子在复盘中进步。
Google旗下Deepmind提出的AlphaGo、AlphaGo Zero、AlphaZero系列算法展示了深度强化学习在棋类领域超凡的能力。2016年AlphaGo横空出世击败欧洲围棋冠军樊麾二段,2017年以4:1击败韩国围棋职业九段,14个世界冠军得主李世石,2018年无师自通的AlphaGo Zero以3:0击败最年轻的六冠王柯洁九段。至此以后再无人质疑AI在围棋领域的霸主地位,同时引发了职业棋手学习AI招法的热潮。在职业围棋赛场上,时常出现“狗招”,学习、研究AI招法的背后的逻辑,已是职业棋手的必修课。

2 现有AI技术存在的问题

Github上已经有了Leela Zero、KataGo等基于AlphaZero系列算法的优秀围棋AI开源项目,它们的主要目标是提升AI的棋力,目前上述围棋AI的棋力已远超人类职业棋手。然而当强AI应用在少儿围棋教学时,出现了“水土不服”的现象,比如:
• AI实在是太强了,人很难在与AI对弈的过程中体会到“旗鼓相当”的感觉,这极易引起用户的挫败感。
• 授人以鱼而未授人以渔,AI只告诉人应该这么下,而不教会人为什么这么下。
• AI的学习路径与人大相径庭,一些在人早期围棋学习阶段就可以掌握的知识(如征子),AI在训练后期才掌握。

3 有道围棋AI团队的成果

有道围棋AI团队隶属于有道人工智能语音组,负责有道纵横产品与围棋AI相关的研发、落地工作,主要发力点在于AI的人机对弈和复盘。现有的工作成果引用一段CEO周枫的话:

有道纵横做到了什么?
总体上有道纵横是一个面向孩子的围棋启蒙课程,大班直播、名师教学,在边学边练过程中有丰富的互动,同时也具备AI对弈能力。与此同时,有道纵横将教、学、练、测、评五个环节做了非常好的整合,形成了这个产品的全貌。
这里面有一个大家也会非常关心的问题,即AI老师到底有没有用?
技术团队永远都说AI老师特别有用,可以解决个性化教学的问题,可以因材施教;老师背景的团队往往觉得AI老师就是洪水猛兽,既没有用而且骗了很多VC的钱。
AI老师到底有没有用?
纵横项目当中做了比较多的AI老师的思考和实践。我们看法是,大众对于AI的认知,其实对于产品团队来说是个双刃剑,只有认识到双刃剑的作用才能做出正确的设计。
什么是双刃剑?一方面AI是一个非常好的营销抓手;另外一方面,用户不懂做产品,团队必须去自己寻找真正的AI价值点。如果你听用户对哪个东西兴奋就做哪个,最后往往掉坑里了。
在AI场景下,我们思考了非常久。首先想到AlphaGo,不管多牛都下得过你,但这么和用户讲显然不可能,所以本身对弈的难度和棋力不是教学当中AI的指标,而是如何降低难度,怎么能够灵活的调整难度。
所以,第一,我们团队花了大量功夫做难度可控的、棋力可控的围棋AI;第二,可控棋力的AI和复盘能力;第三,我们推的是学员和学员、学员和老师之间的对弈,强调人人对弈而不是人机对弈,人机对弈只是找不到人对弈时候的补充手段。
通过这样的手段,我们实现了自主研发的围棋AI,教学过程当中能够代替掉人的部分工作,提高了团队的生产效率。

4 解决方案及思路

4.1 人机对弈

一个理想的人机对弈教学系统具有如下特点:
• AI的招法有逻辑性,用户很难感受到是AI在下棋。
• 合理控制AI的水平,避免一边倒的局面。
• AI可以配合教学进度,帮助用户巩固教学内容(如定式)。

一些其他方案在实现人机对弈系统时,一般使用AI训练过程早期的模型,然后使用模型的top-n输出,随机抽样进行落子行为,避免AI落子过于单一。
这种方案除了易于想到之外没有其他优点,由于早期模型训练量不大,采用top-n的采样方法会导致AI的招式没有条理,用户很容易诱导出这种落子逻辑的漏洞(如征子)。其次,在对弈过程中,AI模型和落子策略是固定的,但我们在实践中发现,AI对于围棋中的布局、中盘、收官等阶段的招法学习速度并不相同,AI对布局的掌握速度远远超出中盘、收官,使用相同的模型和策略会导致AI在整盘棋的表现差异极大。再者,AI的自对弈训练中,没有定式的概念(定式是围棋高手在某些局部的经验总结,用户学习定式走法可以快速提升棋力),低水平的AI很难在局部中下出最优解,而人可以通过学习高手的棋谱快速掌握局部最佳下法,即使人的水平并没有达到提出该定式的围棋高手水平。上述问题的根源在于AI与人的学习路径大相径庭,难以直接移植。

考虑到以上问题后,围棋AI团队做了以下工作:
• 弃用top-n随机抽样的落子策略,使用AI引擎的policy输出,按概率采样。保证了AI招法逻辑性、连贯性。
• 在不同手数阶段,结合胜率和目差信息,调用不用的AI模型。保证AI在不同阶段的水平表现相近。
• 结合教学内容,实现AI模型和定式模板的混合输出。巩固用户学到的定式知识。

4.2 复盘

复盘指对局完毕后,复演该盘棋的记录,以检查对局中招法的优劣与得失关键。一般用以自学,或请高手给予指导分析。下围棋的高手都有复盘的习惯。复盘就是每次博弈结束以后,双方棋手把刚才的对局再重复一遍,这样可以有效地加深对这盘对弈的印象,也可以找出双方攻守的漏洞,是提高自己水平的好方法。在有道纵横产品中,AI承担了复盘老师的角色。
一些其他方案中,AI复盘主要是展示整局棋的胜率或目差曲线、AI的推荐变化图、以及一些基础的统计数据,这些内容更适合专业的用户,专业用户的需求在于快速定位自己下的不好的棋,然后根据AI提供的变化图等推理AI的落子逻辑,此类用户仅根据围棋AI引擎的原始数据就可以完成自我学习。
但是当用户群体定位到少儿时,上述的解决方案效果就会大打折扣,少儿用户很难理解统计数据背后的意义,同时对AI提供的变化图的逻辑缺乏分析能力,甚至注意力很难集中在变化图上,仅关注整局棋的胜率、目差的变化。此外,其他方案采用的复盘使用的GPU资源消耗很大,有的用户甚至需要半天时间才能拿到对局的复盘结果。
考虑到以上问题后,围棋AI团队做了以下工作:
• 引入语音组的TTS技术,将复盘结果翻译成少儿用户易于接受的文案,提升用户的注意力。
• 性能优化,在少儿用户的使用场景中,用户并不需要高算力AI产生的复盘结果,我们指定了根据局面的复杂程度分配算力的方案。
• 结合用户以往的复盘记录,刻画用户的围棋水平,形成长期的学情报告。

5 总结与展望

目前围棋AI的技术主要集中于提升AI水平上,这固然为专业用户自我训练提供了极大的便利,但由于高水平AI背后的行棋逻辑较为高深,当围棋AI为少儿用户提供服务时,少儿用户很难直接从高水平AI获取知识。
接下来我们希望可以在人机对弈场景中,为用户提供水平更合适、逻辑更连贯的AI陪练;在复盘场景中,为用户提供更清晰易懂的复盘报告。

有道围棋 AI:智能匹配儿童棋力的良师益友相关推荐

  1. 腾讯还在提高围棋AI绝艺的棋力,柯洁说已经超过当年AlphaGo

    允中 发自 LZYY 量子位 出品 | 公众号 QbitAI AlphaGo已经退出江湖,但其他围棋AI仍在与人类对战. 11月15日,野狐围棋上的"符合预期"账号重出江湖.野狐围 ...

  2. 日语+AI语音黑科技,早道开启小语种AI智能时代!

    原标题:日语+AI语音黑科技,早道开启小语种AI智能时代! 如果说互联网 +教育 是打破了传统线下教育的时空局限,让每个人有平等享受教育资源的可能.那么AI+教育 则是将教育由"千人一面&q ...

  3. “人工智能+新媒体”论坛热议媒体智能之道,AI推荐系统成转型关键

    11月6日,第四范式主办的 "2018人工智能+新媒体论坛"在京召开.本次论坛聚集了众多资深媒体人士及AI行业代表,对人工智能与传媒技术相融合的创新案例进行了分享与研究.论坛上,针 ...

  4. 2020恩智浦智能车大赛规则_2020年世界人工智能围棋大赛落幕,各路围棋AI共同论道...

    作为今年世界三大人工智能赛事之一,"福建海峡银行杯"2020年世界人工智能围棋大赛于12月3日完赛,上届冠军星阵围棋成功卫冕,采薇围棋.天狗围棋.里拉零分别夺得亚军.季军和第四名. ...

  5. 为何谷歌围棋AI AlphaGo可能会把李世石击溃

    /* 版权声明:可以任意转载,转载时请标明文章原始出处和作者信息 .*/ author: 张俊林 谷歌DeepMind开发的人工智能围棋程序AlphaGo以5:0的压倒性优势击败了欧洲围棋冠军.专业二 ...

  6. AlphaGo对战李世石谁能赢?两万字长文深挖围棋AI技术(二)

    编者按:李世石与Google Deepmind AlphaGo对战在即,围棋界和人工智能界对结果各有预测,但对于程序员来说,了解AlphaGo的技术路线可能更有意思.本文来自出门问问NLP工程师李理, ...

  7. 科大讯飞也推AI智能硬件,K12“知识图谱型”AI教育“真香”?

    文 | 李永华 来源 | 智能相对论(ID:aixdlun) 一次性推出5款新硬件产品,公众认知中一向ToB的"明星企业"科大讯飞前两天的发布会让人"意外",T ...

  8. 费米AI智能棋盘,让国际象棋拥抱新玩法

    国际象棋是一个拥有千年历史的桌游,其战术基本上就是人类智商的体现! 从1997年,IBM的超级计算机"深蓝"打败卡斯巴罗夫:到2007年,谷歌开发的AI"AlphaGo& ...

  9. 围棋AI之路(一)理论

    注:本文其实只介绍mogo程序所采用的MC+UCT算法. 记得以前还曾为深蓝击败顶尖人类棋手而暗喜,庆幸自己选择了围棋这一体现人类智慧优越感的游戏.因为人机博弈的设计不外乎两个方面:估值和搜索,而这两 ...

最新文章

  1. 谷歌编程语言年度榜NO.1:知识体系总结(2021版)
  2. 动态查询设置mysql慢查询
  3. hdu3715 二分+2sat+建图
  4. 元宇宙iwemeta:2021年企业领袖榜公布,曹德旺为终身成就奖
  5. 白话Elasticsearch67-不随意调节jvm和thread pool的原因jvm和服务器内存分配的最佳实践
  6. 排列出所有子串暴力递归
  7. C# 线程手册 第三章 使用线程 Monitor.TryEnter()
  8. 周口a货翡翠,泸州a货翡翠
  9. keil4怎么移植其他人的程序_【调试笔记】韦东山:在100ask_imx6ull上移植使用六轴传感器ICM20608...
  10. 借助邮件网关,为企业实现节源开流
  11. 元数据:数据治理的基石
  12. 人工神经网络理论及应用第三章课后题答案
  13. Android TextView设置下划线
  14. 人工智能的定义与发展史
  15. MISRA-C 2019
  16. SpringCloud中Feign进行服务调用 java.io.IOException: too many bytes written 问题解决
  17. 用java流复制文件不能复制全,少几十兆!!
  18. curl+个人证书访问https站点
  19. 有一篇文章,共有 3 行文字,每行有 80 个字符。编写程序分别统计出其中英文大写 字母、英文小写字母、数字、空格以及其他字符的个数
  20. 通讯录管理系统报告java_java实现通讯录管理系统

热门文章

  1. mysql 重装_重装系统后,mysql应该怎么恢復过去
  2. 使用机器学习预测大盘
  3. centos离线配置yun源
  4. 用户画像 | 标签数据存储之Elasticsearch真实应用
  5. 【环境部署系列 04】Ascend 310(推理)ARM服务器 Ubuntu系统环境部署
  6. 生成Aprilgrid标定板
  7. 一文详解 OpenGL ES 纹理颜色混合
  8. 关于tp-link wr740 v4的刷机救砖的办法(非线刷解决)恢复原版的
  9. MySQL数据库 | 数据表-查询命令详细记录
  10. 微信聊天气泡随意换,一键制作超级简单,让聊天不再枯燥!