近几年来,得益于大数据的积累、计算能力的提升,深度学习从学术到工程领域均取得了非常显著的发展与突破,尤其是诸如图像识别、语音识别等实际场景应用。但是,依赖于海量的训练数据、灵活的模型、足够的运算能力以及足以对抗维度灾难的先验经验,从很大程度上来讲妨碍了深度学习技术更为广泛的运用。为此,在全球范围内,众多人工智能领域的学术大师及业界专家上下求索,也由此催生了小数据学习(Learning from limited information),通过更少的数据以及更确定的方法让 AI 学习更加高效。
然而什么是小数据?机器怎样从小数据中学习?小数据学习将从哪些方面改变人工智能的研究与应用?在即将于 7 月 22 - 23 日举行的中国人工智能大会(CCAI 2017)上,特别邀请到日本理化学研究所先进智能研究中心主任 Masashi Sugiyama,现场为所有参会者一解小数据学习之惑,并分享其团队在监督弱化分类方面的最新研究进展。在会前,记者特别采访了 Masashi Sugiyama 教授,接下来,让我们一起先睹为快。
Masashi Sugiyama 是日本理化学研究所先进智能项目组主任( Director of RIKEN Advanced Intelligence Project)。RIKEN 成立于 1917 年,是日本最大的综合研究机构,其中,由 Masashi Sugiyama 领导的先进智能项目组成立于 2016 年,主要着眼于研发下一代 AI 技术,如小数据学习、因果推理(Causal inference)、不确定性学习(Learning with uncertainty)以及假设检验等,同时,还有加速医学、材料科学、制造业的科研进程,解决基础设施管理、社会抗灾能力、老年医疗保健等社会问题。而 Masashi Sugiyama 教授本人的研究领域则包括机器学习的理论和算法(如协变量适应、密度比预估和强化学习等),及其在实际问题中的应用。
记者:什么是小数据学习?为什么要使用小数据学习?如何实现?
Masashi Sugiyama:虽然现在大数据学习仍是主流,但在很多应用领域,收集到足够机器用来学习的庞大的数据是非常昂贵的。在这种情况下,使用小数据进行学习是一个理想的解决方式。但也有它的弊端,因为当进行小数据学习时,我们需要目标领域中强大的先验知识作为支撑,过多先验知识的介入意味着牺牲掉机器学习的灵活性。所以使用有限信息进行学习的精髓在于,使用领域知识之外的相对便宜的数据进行学习。
记者:若小数据学习能够成功,将对哪些 AI 领域造成改变,进而对哪些行业产生影响?
Masashi Sugiyama:利用小数据进行学习是大数据学习的母集,所以说它一方面可以解决大数据学习不能解决的问题,另一方面在大数据学习已经得以应用的领域也能有所发挥,因为使用小数据学习能够在避免使用昂贵数据的同时达到更优的效果。
记者:您和您的团队在小数据学习方面已经取得了哪些进展?
Masashi Sugiyama:多样性对于小数据学习至关重要,因为对于不同的应用场景,收集数据的局限性是不同的。我们正在研发一种通用的算法使其解决机器学习过程中的不同问题,例如将很多不同种类的未标注数据集进行分类、将标注与未标注数据进行分类、半监督学习中的分类问题、充分标注的数据的分类问题等。
记者:日本的科研机构更倾向于哪些 AI 技术及应用的研究?哪些 AI 应用在日本已经落地?
Masashi Sugiyama:日本的机器学习研究人员更多地关注基础研究,当然,同时也会有一些人在科学及工程领域从事应用科学相关的研究工作。在基础研究与应用之间存在很大的鸿沟,如何搭建鸿沟上的桥梁至关重要。所幸,这些建桥的工作在一些领域已经逐渐展开,例如对癌症及老年痴呆的研究、再生医学、制造业、基础设施管理以及抗灾能力提升的研究等方面。
记者:您认为当前 AI 技术发展的瓶颈在哪儿?并请展望 AI 未来的发展方向。
Masashi Sugiyama:私密性、安全性、以及伦理问题会成为人工智能系统发展的瓶颈。在 AI 技术发展之外,如何分析及管理 AI 可能带来的社会问题也是需要重视的方面。
记者:在本届 CCAI 现场,您将带来的演讲主要关于哪些方面?希望观众从中收获怎样的启发?
Masashi Sugiyama:我的演讲题目是《弱监督学习的最新研究进展》,在演讲中我将介绍我们对于弱监督学习下的分类问题的研究成果,包括将两种类别的无标签数据进行分类、将有标签与无标签数据进行分类、一个对于半监督分类问题的通用方法、以及对于有标签数据的分类。最后,我将简单介绍日本理化学研究所先进智能项目组(RIKEN AIP)。
关于 CCAI
中国人工智能大会(CCAI),由中国人工智能学会发起,目前已成功举办两届,是中国国内级别最高、规模最大的人工智能大会。秉承前两届大会宗旨,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办,云栖社区作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017)将于 7 月 22-23 日在杭州召开。
作为中国国内高规格、规模空前的人工智能大会,本次大会由中国科学院院士、中国人工智能学会副理事长谭铁牛,阿里巴巴技术委员会主席王坚,香港科技大学计算机系主任、AAAI Fellow 杨强,蚂蚁金服副总裁、首席数据科学家漆远,南京大学教授、AAAI Fellow 周志华共同甄选出在人工智能领域本年度海内外最值得关注的学术与研发进展,汇聚了超过 40 位顶级人工智能专家,带来 9 场权威主题报告,以及“语言智能与应用论坛”、“智能金融论坛”、“人工智能科学与艺术论坛”、“人工智能青年论坛”4 大专题论坛,届时将有超过 2000 位人工智能专业人士参与。
目前,大会 8 折优惠门票正在火热发售中,点击链接火速抢票:http://ccai.caai.cn/

CCAI 2017 | 小数据学习对人工智能究竟有着怎样的影响?相关推荐

  1. 「人物特写」清华大学邓志东:“特征提取+推理”的小数据学习才是AI崛起的关键...

    人类是可以进行推理的,只需要从小数据.小样本中学习,然后用特征+推理的方法就可以进行可靠的判别,这就是人类举一反三的能力. 邓志东 清华大学计算机系教授,博士生导师 2017年7月,北京,清华大学. ...

  2. 漆远:小数据学习和模型压缩存挑战,场景成为 AI 技术发展关键

    "蚂蚁金服是一家技术驱动的公司,我们做的事情,是使 AI 技术成为普惠金融的支点."蚂蚁金服副总裁.首席科学家漆远博士,在有中国" AI 春节"之称的新智元20 ...

  3. 清华大学王东:语音识别中的大数据与小数据学习

    原文链接: http://www.199it.com/archives/455137.html 本讲座选自清华语音语言实验室副主任王东于2016年1月19日在RONGv2.0系列--"语言语 ...

  4. 大数据如何帮助小数据? 主题报告速记与评述(二)

    笔者按:机器学习正在走向基于"语义"的可解释模型的新时代,zero-shot learning是其中一个很有价值的方向.参见"A DARPA Perspective on ...

  5. CCAI 2017 | 香港科技大学计算机系主任杨强:论深度学习的迁移模型

     CCAI 2017 | 香港科技大学计算机系主任杨强:论深度学习的迁移模型 原2017.07.22AI科技大本营 作者 | 贾维娣 7月23日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁 ...

  6. CCAI 2017 | 专访德国语言技术领军者 Hans Uszkoreit:深度学习还不足以解决 NLP 核心问题...

    7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,云栖社区作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017) ...

  7. AI 大师云集!CCAI 2017 中国人工智能大会盛大开幕

    7月22日-23日,在中国科学技术协会.中国科学院的指导下,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,,云栖社区独家直播的2017 中国人工智能 ...

  8. 小数据,大前景 !美国智库最新报告:长期被忽略的小数据人工智能潜力不可估量...

    编译:莓酊 编辑:青暮 2021年9月,美国网络安全和新兴技术局(Center for Security and Emerging Technology,简称CSET)发布了研究报告<小数据人工 ...

  9. CCAI 2017 中国人工智能大会 6.4 折抢票倒计时!

    7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,云栖社区作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017) ...

最新文章

  1. 支付宝支付 第四集:配置类的定义和注入
  2. Spring JDBC 示例
  3. 优达学城深度学习之一——Anaconda
  4. 【git】从零开始在git上部署自己的免费生日祝福网页
  5. Softing dataFEED系列--将现场设备集成到西门子工业物联网解决方案
  6. iface eth0 inet dhcp
  7. imx6 android gadget,imx6q安卓启动失败显示Suspending console(s)(已解决)
  8. windbg 常用调试命令总结
  9. 全国多省市遭暴雪袭击!这些路段交通受阻!
  10. 【JavaEE基础与高级 第42章】C3P0连接数据库操作顺序
  11. 遍历同辈节电的方法_家庭节水节电的24个好方法
  12. 神州优车开源业界领先的增量数据同步中间件——DataLink
  13. 机器学习-28-Conditional Generation by RNNAttention(条件生成和注意力机制)
  14. 如何确定自己不是高智商?蒙提霍尔三扇门问题
  15. 喜马拉雅-处世人生-老炮儿崔哥侃美国(完结)
  16. Mathtype和word关联
  17. 一文带你了解火爆的区块链互联网Cosmos
  18. CircuitBreaker断路器
  19. 【毕业设计_课程设计】基于大数据个性化音乐推荐算法分析
  20. ibm服务器raid扩硬盘,IBM x系列服务器RAID卡介绍及配置阵列

热门文章

  1. Node.js「四」—— 路由 / EJS 模板引擎 / GET 和 POST
  2. 复数四则运算 (15 分)
  3. PAT乙级 1021 个位数统计
  4. HashMap底层分析_put添加元素
  5. MyBatis复习(二):mybatis-config.xml核心配置文件
  6. java中的 ok_java okhttp包的类特点
  7. php 判断用户是否刷新,如何在php和ajax中创建一个注册页面,它会在不刷新页面的情况下检查某个用户名是否已经存在? - php...
  8. APUE 12.7 取消选项
  9. Web前端—— JQuery迷你版实现以及使用
  10. 3、vueJs基础知识03