今天,你AI了没?

关注:决策智能与机器学习,学点AI干货

作者 | 思源、李亚洲

报道 | 机器之心(ID:almosthuman2014)

梯度下降或最速下降法,是机器学习最为重要的模块之一。尤其是在深度学习时代,梯度下降已成为不可或缺的组成部分。但同时,梯度下降也限制了机器学习推广到更广泛的一些任务中,例如不可微的目标函数。这一缺陷,却正好能被本书的主题「演化学习」解决。

俞扬教授讲演化学习材料,以及演化算法理论材料打包下载,公众号回复:20190618

什么是演化学习

对于大部分读者而言,机器学习和梯度下降已经是老朋友了,但演化学习却相对陌生。我们可以将各种机器学习算法总结为三大主要模块,即如下所示的模型表征、模型优化和模型评估。

原书图 1.1:典型机器学习过程的三大组成模块。

我们很容易理解,ML 需要支持向量机、神经网络或决策树等算法构建模型空间,然后在训练数据上利用学习算法找更好的解决方案。当然,在找最优模型的过程中,模型评估会将模型的好坏直接反馈给学习算法,从而指导学习的持续进行。

那么 EA 在机器学习中处于什么位置呢?按照维基百科的描述:「演化算法启发自生物的演化机制,模拟繁殖、突变、遗传重组、自然选择等演化进程,从而对最优化问题的候选解做演化计算。」所以,演化算法对应于上图的学习算法,它是一种模拟自然演化的「学习过程」。

所以演化学习究竟是怎样进行的,它会不会也有这样一个整体框架?后面我们将介绍该书第一章描述的演化学习。

演化学习的主要流程

演化算法(EA)是一大类启发式的随机优化算法,它受到了自然演化的很多启发。一般 EA 会考虑两个关键因素来模拟自然过程,即变异繁殖(variational reproduction)和择优挑选(superior selection)。尽管演化算法有很多不同的实现,例如遗传算法(GA)、遗传规划(GP)和进化策略(ES),但典型的 EA 主要能抽象为以下四个步骤:

1. 生成一组初始解(称为种群/Population);

2. 基于现有的种群繁衍一些新的解(solution);

3. 移除种群中相对差的解;

4. 返回第二步并重复运行,直到遇到了终止标准。

这四步可以构成演化算法的主要流程:

原书图 1.2:演化算法的一般结构。

演化算法实例

在使用 EA 解决最优化问题之前,我们需要决定如何表示解(solution)。例如,如果问题是从基准集中选择一个子集,那么一个解可以自然地表示为一个布尔值(0 或 1)向量。如下图 1.3 所示,{v1, v2, . . . , v8} 的子集能自然地表示为长度为 8 的布尔值向量。其中第 i 个元素为 1 意味着选择了 v_i,因此 {v1, v3, v4, v5} 能表示为 (1, 0, 1, 1, 1, 0, 0, 0)。

原书图 1.3:表示解的一个案例。

基于解的表征方法,EA 通过图 1.2 所示的循环就开始了演化。在循环演化过程中,EA 会保留解的整个种群,并通过迭代繁衍新的后代解而不停地更新种群。突变与重组(或称为交叉)是繁衍的两种常见操作方法。突变(Mutation)会随机修改一个解以生成新的解。

如下,图 1.4 展示了布尔值向量所产生的单个元素突变,即随机选择一个元素,并将其修改为另一个布尔值。

原书图 1.4:布尔值向量解上的单比特变异。算法首先会随机选择 Parent 解上的一个位置,然后改变该位置的布尔值,并生成后代解。

重组会混合 2 个或多个解以生成新的解。下图 1.5 展示了两个布尔值向量所完成的单点重组,即随机选择一个位置,然后交换该位置后面的值。

原书图 1.5:两个布尔值向量上的单点重组。算法随机选择两个 Parent 解的某个相同位置,并交换该位置后面的值而生成两个后代解。

新生成后代解之后,我们需要使用适应度函数(fitness function)度量它们的好坏。如果我们使用某些挑选机制,从老种群的解、新生成的后代解中择优挑选,那么就能构建新的种群。当满足停止标准时,演化周期就结束了。目前有一些停止准则,例如是否有满足预定义质量的解、计算资源的预算上限(例如运行时间)、或解不会随着迭代的进行继续提升。

从整个迭代过程中可以看到,EA 在求解最优化问题时,它只需要以某种方法表示解,并能够对解的好坏进行评估,从而可以搜索更好的解。因此,EA 在没有梯度信息、甚至在没有明确目标函数时都能使用,它只需要存在某种方法能通过实验或模拟评估解的好坏就行。因此,EA 被视为一种通用的最优化算法,我们甚至能以「黑盒」的方式解决某个最优化问题。

由于通用属性,很多研究者已经利用 EA 来解决机器学习中的复杂最优化问题。例如,EA 可以用来最优化神经网络,包括连接权重、架构和学习规则。这种演化的人工神经网络模型能实现非常好的性能,甚至能媲美手动设计的模型。然而,尽管演化学习已经取得了很多成功,但它缺少坚实的理论基础,也很难受到机器学习社区的广泛认同。

力作:「演化学习:理论与算法进展」

南京大学周志华教授、俞扬教授、钱超博士出版了一本名为「演化学习:理论与算法进展」的专著。在这本书中,总结了作者在这个主题上近二十年的研究成果,并从理论到算法概述了它对目前机器学习研究的意义。

目前,该书已在 Springer 官网正式上线,且开放了Preview。

书籍地址:https://www.springer.com/cn/book/9789811359552

书籍简介

本世纪初,本书第一作者周志华与其合作者开展了「选择性集成」的研究,通过从一批训练好的神经网络中选择一个子集进行结合,泛化性能甚至优于结合所有神经网络。该工作中引入了一种名为遗传算法的演化算法(Evolutionary Algorithm, EA)。

周志华认为,演化算法作为一种强大的非经典优化方法,可能对许多机器学习任务都有用。但那时候,演化算法基本上都还是纯启发式的,理论氛围浓厚的机器学习社区并不青睐这一类方法。周志华相信演化算法在应用中神秘成功的背后必有理论解释,并决定开始研究。周志华的学生俞扬、钱超也相继投入该领域的研究,这一研究就是十几二十年。

最开始研究演化算法时,作者们遇到了很多困难。正如俞扬所说:「从 2005 年硕士入学开始,抱着演化算法理论这个硬骨头就开始啃。这个领域真是四处不讨好,让我深刻体验了什么叫冷板凳。即使是在演化计算领域里,对于搞应用的来说,理论太滞后,没有指导意义,甚至关注理论进展的人都很少。而放在整个人工智能领域里,更是艰难,当时演化计算就已经是在顶级会议上冷下去的话题了。」

经过周志华等研究者的共同努力,目前演化学习已经不再是完全缺乏理论支撑的「玄学」,其关键成分上已经有了理论结果,并且对算法设计能够给出一定的指导,使得演化学习成为一个有理论基础的研究领域。总而言之,这本书大部分内容都是三位作者在过去近二十年里取得的研究成果,值得一读。

内容概要

机器学习之所以称之为「学习」,很大程度在于模型会通过最优化方法逐渐「学习」一些新知识。但目前主流模型常常要求目标函数是连续、可微的,不然的话梯度下降方法难以有效。这是一个很强的要求,别说可微的目标函数,在一些机器学习任务中甚至都难以定义明确的目标函数。

这时就可以考虑使用无需明确给出目标函数形式的演化学习技术。而演化算法确实在很多应用中产生了令人惊艳的结果。不过由于演化算法的「启发式氛围」太过浓厚,很多结果都是经验性的,缺乏理论支持。最近很多研究者都在努力解决这个问题,而这本书则介绍了这方面的一系列探索与研究工作。

本书包含四部分内容:

  • 第一部分介绍了演化学习和一些基础知识,它能为读者提供一些预备知识。

  • 第二部分给出了关于演化学习的两个最重要性质——时间复杂度和近似能力——的理论分析方法。这一部分给出的方法是演化学习理论分析的通用性基础工具。

  • 第三部分给出了关于演化学习的关键技术环节的理论分析,包括演化算法的算子、表征、评估和种群等。

  • 第四部分以选择性集成等机器学习任务为例,展示了如何分析和设计有理论支撑的演化学习算法。

作者们希望第二部分的通用理论工具可以帮助到有兴趣探索演化学习理论基础的读者;希望第三部分的理论结果可以加深读者对演化学习过程行为的理解,并且提供一些关于算法设计的见解;此外,作者们还希望第四部分的算法可以有效地用于机器学习实际应用中。

作者简介

本文作者主要有三位:

周志华,现任南京大学人工智能学院院长,南京大学计算机科学与技术系主任、南京大学计算机软件新技术国家重点实验室常务副主任、机器学习与数据挖掘研究所 (LAMDA) 所长,校学术委员会委员。周志华是 ACM、AAAI、AAAS、IEEE 和 IAPR Fellow,主要从事人工智能、机器学习、数据挖掘等领域的研究工作。

俞扬,博士,南京大学教授,博士生导师。主要研究领域为人工智能、机器学习、强化学习。2011 年 8 月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。俞扬获得了 4 项国际论文奖励和 2 项国际算法竞赛冠军,入选 2018 年 IEEE Intelligent Systems 杂志评选的「国际人工智能 10 大新星」,获 2018 亚太数据挖掘「青年成就奖」,受邀在 IJCAI'18 作关于强化学习的「青年亮点」报告。

钱超,南京大学,博士。主要研究方向为演化计算与机器学习。以第一作者在 AIJ、TEvC、ECJ、Algorithmica、NIPS、IJCAI、AAAI 等国际一流期刊和会议上发表二十余篇论文。获 ACM GECCO'11 最佳理论论文奖、IDEAL'16 最佳论文奖,担任 IEEE 计算智能学会 Task Force on Theoretical Foundations of Bio-inspired Computation 主席,入选中国科协「青年人才托举工程」。

附全书目录

相关推荐

  • 深度强化学习的经典入门课程(附链接) | 课程地图

  • 强化学习 | 基于强化学习的机器人自动导航技术

  • 干货 | 深度强化学习国际顶会ICML-2019最新进展速览—论文PDF打包下载

  • 最新 | 用深度强化学习打造不亏钱的交易机器人(附代码)

  • 深度强化学习领域盘点系列 | 大神篇

  • 深度强化学习领域盘点系列 | 大厂机构篇

   交流合作

商务合作以及加入微信群,请添加微信号:yan_kylin_phenix

注意:请务必说明您的意向,注明姓名+单位+从业方向+地点,否则不予通过,请多谅解。

【重磅】《演化学习:理论与算法进展》| 南大周志华、俞扬、钱超重要成果...相关推荐

  1. 南大周志华团队开源深度森林软件包DF21:训练效率高、超参数少,普通设备就能跑 | AI日报...

    中国学者研发新型电子纹身,实现8倍延展,有望用于医疗.VR和可穿戴机器人等领域 可穿戴设备,已经成为我们生活中极为常见的一种设备,它们体积轻巧.佩戴方便.检测数据齐全,但也存在一个很明显的缺点--无法 ...

  2. 南大周志华postgr

    南大周志华对于研究生入学要求 2022.12.22_ Tsongli For Potential Students If you are interested in pursuing a degree ...

  3. 南大周志华清华胡事民入围院士候选!计算机领域共计7人

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 2021 ...

  4. NIPS论文排行榜出炉,南大周志华5篇论文入选

    作者 | 非主流 出品 | AI科技大本营 作为人工智能领域的顶会,已经有 30 年历史的 NIPS 今年以来一直风波不断.先是被爆出 NIPS 2017 出现了性骚扰行为,然后又被 diss 会议名 ...

  5. 2021中科院院士候选名单出炉:清华胡事民、南大周志华等人在列

    8 月 1 日,中国科学院公布了 2021 年院士增选的初步候选人名单,清华大学计算机科学与技术系教授胡事民.南京大学人工智能学院院长周志华等 191 人进入了该名单. 这份名单分为数学物理.化学.生 ...

  6. 南大周志华教授入围院士候选!计算机领域共计7人

    明敏 发自 凹非寺 来源 | 量子位 QbitAI 2021年中国科学院院士增选初步候选人名单现已公布. 人工智能领域有南京大学人工智能学院院长周志华教授.清华大学胡事民教授入围增选. 计算机领域共有 ...

  7. 高考报 AI 专业?南大周志华:当然!清华孙茂松:再考虑一下

    By 超神经 场景描述:又到了高考放榜的时刻,接下来就是准大学生们选专业的环节.「人工智能」首次成为本科可选专业,在风头正盛的当下,到底该如何去抉择?不妨从行业大佬以及网友的看法中,去看看热潮背后的冷 ...

  8. 南大周志华教授写给学生的话

    周老师(个人还是比较喜欢以老师这个高尚的职业称呼他,而不是以个人的title)的简历 周志华,男,1973年11月生.分别于1996年6月.1998年6月和2000年12月于 南京大学计算机科学与技术 ...

  9. 机器学习两大派别--南大周志华

    //2014年11月7日 //http://quweiprotoss.blog.163.com/blog/static/4088288320099178652101/ 机器学习现在是一大热门,研究的人 ...

  10. AI 的会议总结(by南大周志华)

    原文链接:http://blog.csdn.net/akipeng/article/details/6533897 这个列的更详细:http://www.cvchina.info/2010/08/31 ...

最新文章

  1. 排序算法----插入排序
  2. 费曼学习法与孔子温故知新学习法为两大重要学习法,前者外向表现,后者内省提升
  3. linux kernel的中断子系统之(三):IRQ number和中断描述符【转】
  4. 深入理解JVM(5) : Java垃圾收集器
  5. iOS之深度剖析UIScrollView的实现原理与阻尼动画
  6. XML的四种解析器(dom,sax,jdom,dom4j)原理及性能比较
  7. HDU4267(2012年长春站)
  8. linux文件被覆盖如何恢复_在Linux下误删文件后恢复
  9. iOS NSString追加字符串的方法
  10. busybox inittab
  11. lhgcoreDialogPlugin v3.5.2 使用点滴
  12. 文件怎么更新_iOS屏蔽更新描述文件以及超级详细安装方法分享
  13. java bigdecimal取余_BigDecimal求余操作
  14. Quick_Cocos2d_x V3.3 Protobuf Android
  15. python股票代码示例_Python应用实例之股市数据分析
  16. 一IT公司hr对软件外包感受(转)
  17. 苹果发信用卡,其它硅谷巨头如何发力金融科技?
  18. Clickhouse 生成日历表
  19. Voyager的Roles和Pemissions
  20. 区块链黑客马拉松是到底是什么?

热门文章

  1. 【计算机专业日志100篇ctrlc、ctrlv】
  2. 宽带波形测试软件,适用于5G时代的波形测试分析系统是怎样的?
  3. python imshow彩色_matplotlib实现显示伪彩色图像及色度条
  4. 技术经济与企业管理复习知识点总结
  5. 常用MATLAB工具箱下载地址
  6. 【python】py课上机作业3「谢尔宾斯基三角形」「递归输出列表」
  7. A类业余电台操作证书考试内容提要
  8. 如何通过广西税务12366缴纳城乡居民医保费用及下载缴费凭证?
  9. 计算机桌面显示保护眼睛设置,教你把电脑屏幕设置成可以保护眼睛的颜色
  10. 配对算法(Gale-Shapley)实现