AlphaZero是DeepMind围棋软件AlphaGo的升级版。虽然AlphaZero在围棋项目上战胜了人类选手,但所需的大量算力使其很难走进寻常人的生活。最近,丹麦和德国的研究人员使用Deepmind的AlphaZero开发了一种混合算法,将AlphaZero强大的搜索能力与量子计算有机结合起来,参数搜索速度大幅提升。

本文来自微信公众号:新智元(ID:AI_era),原标题:《下围棋so easy ,AlphaZero开始玩量子计算!》

在过去几十年量子物理技术的探索中,最引人注目的就是量子计算机。

量子计算机的能力,所有现有的计算机组合加起来都无法匹敌。但到目前为止还没有人能够制造出一台功能齐全的量子计算机。这就需要我们在控制量子系统的能力上向前跨一步。

为什么 AlphaZero 能快人一步“预知未来”?

AlphaZero一开始是专门用来下围棋的。围棋的落子位置太多了大约有10^170种。相比之下,国际象棋只有10^43种可能的走位。

所以AlphaZero使用了一个深层的神经网络,它学会了从一个特定的位置开始评估它获胜的可能性。为了获胜,AlphaZero使用蒙特卡洛树搜索,这种方法能够帮助它在游戏中“预知未来”。

由于在所有可能策略中抽样的可能性比较小,而且神经网络只能近似估计,所以特别是在其训练阶段,蒙特卡洛树搜索能够极大地提高游戏的准确性以及训练效率。

这类似于职业棋手在下棋时能够提前想几步棋。训练结果是相当惊人的,AlphaZero 很快就摧毁了专业游戏软件和人类玩家。例如,经过仅仅四个小时的自我对弈练习,AlphaZero 就在国际象棋中击败了领先的棋类软件 Stockfish。而且这完全都是从零开始,一开始AlphaZero根本不知道游戏规则。丹麦国际象棋大师Peter Heine Nielsen将其比作一个访问过地球的高级外星物种。

目前AlphaZero 已经有效地在围棋,国际象棋和星际争霸中战胜对手。AlphaZero成功的关键是将蒙特卡罗树搜索和具有前瞻性的深度神经网络结合起来。结果表明,从树下方延展出来的预测信息极大地提高了深度神经网络的精度,使预测结果更加准确集中,而非试探性的探索。

AlphaZero后发制人:30小时性能提高一个数量级

与普通计算机类似,量子计算机使用门操作(gate operations)来操纵其量子位。我们试图通过构建分段恒定的脉冲序列来实现特定的门操作,即AlphaZero必须为每个时间步长(time-step)选择一个脉冲幅度。物理系统在每个时间步长tj上都由一个4x4复杂的矩阵U(tj)进行数学描述,我们将其折叠成一个长度为32的向量。这是神经网络的输入,如图1所示。脉冲序列完成后,就可以将复数矩阵U(T)映射为一个实数,称为仿真逼真度(fidelity)F,该实数的取值在0到1之间。从本质上讲,仿真逼真度是一种概率度量,其中1表示100%成功。

图1.AlphaZero使用的MCTS(左)和深度神经网络(右)的图示

左图和右图分别演示了 AlphaZero 的树搜索和神经网络。利用树搜索中统一的搜索结果作为神经网络的输入项。神经网络的上限输出接近给定输入状态的现行策略。同时,下限输出提供了一个能够预估期望最终报酬的值函数。在我们的工作中,我们发现以一致的形式向 AlphaZero 提供物理系统的完整信息,有利于提升它的性能,尽管这种方式可能比较难以调整以适应具有较大希尔伯特空间的系统。

简言之:蒙特卡洛树搜索允许AlphaZero向前看几步,从而可以在解决方案空间中进行更全面的搜索。这使得AlphaZero在长期策略至关重要的复杂任务中比大多数其他强化学习方法更具优势。

混合了AlphaZero的量子计算,搜索速度提升500倍

AlphaZero会输给物理学家在过去15年不断完善的高度量子化的优化算法并不奇怪。但是,如果AlphaZero死在这里,会留下很多遗憾。

由于梯度优化算法没有学习功能,意味着训练过程中其性能没有逐步提高,并且所有生成的数据都将被丢弃,而不是用于后续学习。

奥胡斯大学的团队开始寻求一种混合算法:AlphaZero通过广泛的探索生成了高可用的种子对象,随后通过基于梯度的方法对它们进行优化,这种方法使解决方案的数量和质量都得到了极大的提高。

实际上,AlphaZero和梯度优化解决了不同的问题:AlphaZero能学习到解决方案的基础结构,梯度优化在种子解决方案周围的局部空间中进行优化。如果仅使用梯度优化,经过50小时的模拟,我们可能有两个或三个有前途的解决方案,但通过混合算法,可以获得一千个。

将功能强大的通用领域机器学习方法与人类专业知识、特定领域的蛮力计算相结合的结果令人振奋。国际象棋已经迈出了第一步,混合型人机团队将专家知识和Stockfish引擎结合起来,可以同时胜过人类和算法。

最近Gary Marcus和Ernest David在他们的新书《重新启动AI:构建我们可以信赖的人工智能》中提出,将领域特定方法和领域通用方法与分层的受人类启发的决策过程相结合,是未来构建强大的AI方法的核心元素之一。这可能会解决AlphaZero方法最直接的弊端之一:超参数很多,但仅在有限的范围内有用。

在一些案例中,相同的超参数集在三种量子情况下均能很好地工作,当改变问题的设定,AlphaZero将无法解决。

量子计算机利用量子并行性大幅提高了计速度,但是问题再次出现:搜索空间的控制参数成指数级增长。AlphaZero实验证明,神经网络提供的近似和不完善的解决方案可以充当本地蛮力启发式算法的强大种子生成器。

除了算法方面的优化设计,量子计算本身的性能也在飞速提升。

金子表面发现马约拉纳费米子,量子计算机时代要来了?

最近量子计算捷报频传。

丹麦、德国科学家奇思妙想用AlphaZero解决量子计算问题,MIT等科学家则在金子的表面,观测到了马约拉纳费米子,从而在将粒子分离为稳定的、防错的量子比特进行量子计算领域迈出了重要的一步,该结果发表在《美国国家科学院院刊》上。

在粒子物理学中,马约拉纳费米子是一类基本粒子,包括电子,质子,中子和夸克,它的反粒子就是它本身。由意大利理论物理学家Ettore Majorana在1937年首次提出。

马约拉纳费米子

然而不幸的是,这位物理学家提出该理论后不到一年时间,就在一次神秘的意大利海岸渡轮旅行中失踪了。从此,大家就一直在寻找马约拉纳和他的马约拉纳费米子。最终,大家放弃了寻找马约拉纳,但却从未停止寻找他的费米子。

现在,由MIT领导的团队制造了在超导材料钒上生长的金纳米线组成的材料表面,发现了接近零能量的特征信号尖峰。显然,根据目前的理论物理学来看,除了马约拉那费米子对,没有其他可能。

马约拉纳费米子将是理想的量子比特或量子计算机的单个计算单位,一个量子位将由成对的马约拉那费米子组成,这是科学家长期以来,一直梦寐以求的材料!

如果该马约拉纳费米子被彻底证实,我们将提前步入量子计算时代!

参考链接:

https://aihub.org/2020/04/03/alphazero-learns-to-solve-quantum-problems/

https://www.nature.com/articles/s41534-019-0241-0

https://phys.org/news/2020-04-sighting-mysterious-majorana-fermion-common.html

光量子计算机 围棋,最强围棋AI,玩起了量子计算?相关推荐

  1. 从 AI、芯片到量子计算,阿里达摩院发布 2020 十大科技趋势

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :阿里达摩院 [人工智能资源 ...

  2. 为什么量子计算机比经典计算机更强大,最新从实验层面证明:量子计算,确实比经典计算更具优势!...

    量子计算和量子传感有可能比经典的强大得多,一台完全实现的量子计算机不仅可能只需几秒钟就能解出经典计算机需要数千年才能解决的方程,而且还可能对从生物医学成像到自动驾驶等领域产生不可估量的影响.然而,这项 ...

  3. 量子的计算机,23年前钱学森的一封信,为中国量子计算发展指明方向

    张梦怡 科技日报记者 吴长锋 日前,一份钱学森与郭光灿院士有关量子信息的讨论书信手稿,现身由国家网信办等单位联合举办的第五届"强网杯"系列活动中. 这份手稿的收藏者中国科学院院士. ...

  4. 光量子计算机在哪个国家诞生,光量子计算机是在中国诞生的吗

    满意答案 s14878120 2017.11.22 采纳率:55%    等级:9 已帮助:868人 5月 3日,科技界迎来了一个振奋人心的消息:世界上第一台超越早期经典计算机的光量子计算机在中国诞生 ...

  5. 下围棋so easy ,AlphaZero开始玩量子计算!

    来源:新智元 本文约3073字,建议阅读9分钟. 本文介绍丹麦和德国的研究人员使用Deepmind的AlphaZero 开发了一种混合算法,将AlphaZero强大的搜索能力与量子计算有机结合起来,参 ...

  6. DeepMind训练AI玩足球,风骚走位比中国男足都强(狗头)

    来源:AI科技评论本文约4200字,建议阅读9分钟本文带你了解DeepMind训练的 AI 玩足球. AI踢足球可以有多燃? 不好,对方攻到底线了!看我一脚精准拦截.抢球! 想抢回去?没门! 差点被进 ...

  7. 人工智能:从经典计算机到量子计算机,弱AI进阶到强AI时代?

    人工智能(Artificial Intelligence,缩写AI),通常指通过普通计算机程序来呈现人类智能的技术.计算机是为AI提供必要的技术基础,它决定人工智能的上限空间.人工智能分为弱人工智能和 ...

  8. 教ai玩游戏_简单解释:DeepMind如何教AI玩视频游戏

    教ai玩游戏 by Aman Agarwal 通过阿曼·阿加瓦尔(Aman Agarwal) 简单解释:DeepMind如何教AI玩视频游戏 (Explained Simply: How DeepMi ...

  9. NeurIPS 2022 | 最强斗地主AI!网易互娱AI Lab提出基于完美信息蒸馏的方法

    视学算法专栏 作者:网易互娱 AI Lab 网易互娱 AI Lab 联合上海交通大学和 CMU 提出了基于完美信息蒸馏的斗地主 AI--PerfectDou,击败了一众 AI 模型,成为目前的最强斗地 ...

最新文章

  1. SqlHelper中IN集合场景下的参数处理
  2. 1.5 成员方法的声明和调用,形参,实参
  3. NLP的一些学习资料
  4. php与mysql连接程序_PHP与Mysql连接
  5. 用纯css3和html实现一些复杂的泡沫对话框
  6. 计算机培训三下乡实践报告,暑期“三下乡”社会实践心得体会范文
  7. mysql 核对_mysql索引 (校验规则引发的血案)
  8. 批量word删除页眉页脚——VBS脚本,在office宏中运行即可
  9. 【Python数据分析实战】豆瓣读书分析(含代码和数据集)
  10. android 截屏 水印,水印截图工具微商截图
  11. struct termios结构体详解
  12. 帆软报表参数传给网络报表_自定义报表之自定义参数界面
  13. lcd屏幕有mipi接口吗_液晶屏MIPI接口与LVDS接口区别(总结)
  14. 服务端判断客户端是移动端浏览器还是PC端浏览器
  15. 两行命令查看wifi密码
  16. Raspberry Pi 4 树莓派4 支持操作系统
  17. 华东师范大学计算机坏老师,华东师范大学:2020各专业录取分数线!毕业当老师的都是铁饭碗...
  18. 垃圾填埋场渗滤液的主流处理方法
  19. c++ 操作hadoop
  20. 生产环境容器落地最佳实践 - JFrog 内部 K8s 落地旅程

热门文章

  1. 中国建筑业未来趋势及十四五前景预测报告2022-2028年
  2. [个人小记]什么是APT攻击
  3. Vue项目中$t()的意义
  4. [精简]托福核心词汇90
  5. 网易云音乐2020校招
  6. 攀枝花市中西医结合医院信息数据容灾系统采购
  7. 安卓开发学习-Android Studio-12-adapter
  8. 行业动态-DALI联盟开放DALI技术手册中文版下载
  9. eNSP中RIP配置
  10. 【Xilinx】如何用sdk编译vcu-qt