最早提出大数据时代到来的是知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

其实大数据无论在哪一领域都存在已有时日,却在近年来的互联网和信息产业的发展之下得以聚合、得以提炼分析。

要做到人工智能,背后需要有丰富的大数据做支撑。亿欧8月12日在CCF GAIR全球人工智能与机器人峰会上听取了香港科技大学教授、人工智能和数据挖掘专家杨强的主题分享,有关“人工智能成功的几个条件”,其中分享了几个很有意思的观点,亿欧对其进行整理补充,分享如下。

AI成功的5大必要条件

1、清晰的目标,商业模式,离不开领域对目标很好的理解;

2、需要高质量的大数据,这个数据要持续反馈,这使得学习不断提高,推的数据质量高,要与算法不断匹配,样本要针对算法手机,要持续得到,数据的标记是非常昂贵;

3、清晰的问题定义和领域边界;

4、懂人工智能的跨界人才,懂智能懂商业,身边善于学习的人,可以将两个不同的垂直领域链接到一起,擅长应用和算法;

5、计算能力。

把人工智能往前推一步,继深度学习之后哪些技术会是下一个热点?

互联网泡沫、大数据的驱动下,机器学习以及人工智能领域在后台的支撑力度越来越大。深度学习之后会有哪些技术是下一个热点?杨强提出了三明治结构学习法,分别为递归深度神经网络RNN、强化学习RL、以及迁移学习TL。

递归深度神经网络RNN最早是在1992年由施米德林(DeepMind联合创始人、深度学习四大巨头之一)和他的学生团队提出的,非监督学习时间递归神经网络,为语音识别和自然语言翻译提供了重要的模型。

强化学习(ReinforcementLearing),就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。什么是迁移学习?即在源领域已经拥有大量数据,并且在源领域能对数据进行很好的应用建立了模型后,我们换一个领域也能让它使用,这样既节省了资源,又达到时间和效果的好处,就叫做迁移学习。这就很像人的举一反三的学习能力,比如我们学会骑自行车以后,我们又去学摩托车,发现很简单,我们打球、学语言、学物理化学也有很多这样的例子。

实现迁移学习的方法有四种:1)样本迁移;2)特征迁移;3)基于模型的迁移学习;4)通过关系进行迁移,比如社交网络。

第一种就是我们在数据集里面找到跟目标领域相似的数据,把这个数据放大多倍,这个叫做样本迁移,通过样本来达到迁移的目的。其次我们可以观察到有些相似的特征,然后利用这些特征,在不同的层次的特征,来进行自动的迁移,这种叫做特征迁移。然后我们还可以做到基于模型的迁移,这是这样的一个工作。利用上千万的图象来训练一个图象识别的系统,我们遇到一个新的图象领域,我们就不用再去找几千万个图象来训练了,我们就把原来的那个迁移到新的领域,所以在新的领域只用几万张图片就够,同样可以得到很高的效果,这叫做模型迁移,模型迁移的一个好处是我们可以区分,就是可以和深度学习结合起来,我们可以区分不同层次可迁移的度,相似度比较高的那些层次他们被迁移的可能性就大一些。最后我们也可以通过关系来进行迁移,比方说社会网络,社交网络之间的迁移。

一个不争的事实,大数据只有富人才能得到

深度学习是离不开大数据的,大数据又离不开大公司,我们所熟知的大公司都是大数据的拥有者,而中小型的公司是没有大数据的,也没有获取大数据的能力。

要做到深度学习,离不开对特征的选取,特征的选取又离不开大数据,而这些大数据只有富人才能得到。

数据在哪里?领域到底有没有大数据?钱在哪里?

“数据在的地方,我们要看有没有钱来驱动我们去做人工智能的研究工作。哪些领域的钱已经准备好了?这里我要提出一个概念叫封闭系统,刚才我讲边界清晰问题定义非常清晰就是指的这样一个封闭系统,就是说整个的商业流程都有数据的脚印,全部的留下来,我们看一下,我们今天在教育领域到底有没有这样的数据,我们在出行的领域有没有这样的数据,我们在金融、医疗的领域,所以在这些领域里面我觉得比较看好的一个是金融的领域,因为在金融里面每一步都太关键太重要了,所以在很早以前就有很多人把所有的整个的商业流程全部的记录在案,用数字化的方法,只不过存在那里没有在用。虽然有很多不同的政治、经济角度在来影响它,但是大家不要忘记人工智能的商业成功只要系统比人好一点点就可以了,就像在奥运会里面我们得到的金牌比银牌好一点点就可以了,所以在信息的处理和未来的预测方面,如果在一个封闭系统里面,在有大数据的前提,又有资金推动的影响下,我觉得这个领域差不多就会成功了。”

人工智能不能关在象牙塔里面

早在2013年香港科技大学和张小龙的微信一起成立了一个联合实验室。“微信为我们提供非常好的平台,我们做人工智能不能关在屋子里,不能拿一个象牙塔的姿态来做,一定要放开胸怀,让我们做的东西能够铺会越多的人去用,去让他们能够受益越好。”杨强说到,“微信提供了平台,特别难的学术问题我们会自己留下来,我们会给微信提供资源,我们有十几个教授,我们实验室从机器人到自然语言处理、语音识别、图像处理、图像识别、包括对话系统等等。在这样互相受益的情况下做这样一个实验室我们才觉得是一个双赢,是一个有很好的情景。”

看好的下一个商业方向

人工智能到现在为止最成功的一个领域就是机器学习。

机器学习的基本概念就是从数据里面经常重复的现象学出规律来,人工智能在商业上面应用的一个很强烈的特征,就是,我们要去观察我们商业活动当中哪一些数据能够让我们替代掉人类简单、重复、繁琐的这类工作。然后那些奇思妙想、创新的东西就交给人类, 人类能给人工智能当老师。

在杨强看来,下一个最看好的商业方向,便是将人和机器进行有机结合的领域。

本文作者吴妙芸,亿欧专栏作者。本文转载自 亿欧网

天云大数据

天云大数据是专注于大数据分布式计算平台软件、AI算法的国家高新科技企业。孵化并成长于北京云基地的天云大数据是北京祥云工程代表企业,作为秘书长或理事成员参与了中国云产业联盟,中关村大数据产业联盟,国家统计局大数据战略合作企业,中关村-滨海大数据产业技术创新战略联盟,上海大数据产业技术创新战略联盟的筹建。被硅谷GigaOM大数据先锋评论冠以改变中国云计算最有影响力的企业;帮助某全国性股份制商业银行获得了国际化组织IDC的“2014年度中国金融行业最佳创新项目”大奖;2016年荣选由毕马威评选的中国领先金融科技公司50强企业。

更多精彩内容请关注微信公众号:BeagleData_

大数据时代下的迁移学习_继深度学习后,下一个热点技术是迁移学习相关推荐

  1. 大数据时代,AIoT在智慧社区的深度应用

    佳都新太科技股份有限公司 刘弘胤 1.AIoT的发展现状与特点 1)AIoT的定义 AIoT是近几年流行起来的热词之一,特指在人工智能加持下的物联网,通过人工智能(AI)与物联网(IoT)的结合,使得 ...

  2. 那些被大数据时代抛弃的人

    作者 | 衣公子 来源 | 衣公子的剑(ID:yigongzidejian) 前言 2000年,微软如日中天.有人问比尔盖茨(Bill Gates)对于IT行业的看法. 盖茨说,挺好的,就是有点noi ...

  3. 大数据时代,前端开发者该如何提升自身竞争力(附教程视频)

    重点在文尾!!! 提升技能是一条慢长而艰苦的道路,不能靠一时激情,也不是熬几天几夜就能学好的,必须养成平时努力学习的习惯.所以: 贵在坚持与选择! 这一天我不钓虾,东西也少吃.母亲很为难,没有法子想. ...

  4. 大数据时代,企业如何进行有效的信息资源整合?

    数据被认为是新时期的基础生活资料与市场要素,重要程度不亚于物质资产和人力资本.近年来,企业产生的数据量呈指数级增长,信息资源爆炸式激增,其中非结构化的数据信息达到85%左右,传统的信息资源管理技术已经 ...

  5. 诸葛io 大数据时代,企业如何打好信息资源整合攻坚战?

    本篇文章,诸葛io针对大数据时代,企业如何打好信息资源整合攻坚战?这个话题来给大家做个分享~ 数据被认为是新时期的基础生活资料与市场要素,重要程度不亚于物质资产和人力资本.近年来,企业产生的数据量呈指 ...

  6. 大数据时代传播研究中语料库分析方法的价值

    [摘要]:大数据时代的研究逻辑,对传播学研究形成了新的冲击,传统的文本分析方 法,已经不能满足对样本数量的宏阔和数据挖掘深度上的双重要求.语料库的研究方法 在数据新闻.舆情监测和学术研究等领域都可以得 ...

  7. 独家 | Michael I.Jordan:大数据时代下的安全实时决策堆栈与增强学习(视频+精华笔记)

    金秋九月,2017国际大数据产业技术创新高峰论坛暨大数据系统软件国家工程实验室第一次会议盛大开幕,大数据系统软件国家工程实验室作为大数据系统软件技术研发与工程化的国家级创新平台,将通过大数据系统软件技 ...

  8. 大数据审计的发展_浅谈大数据时代下审计工作的发展方向

    浅谈大数据时代下审计工作的发展方向 李寒梅 [摘 要] [ 摘 要 ] 随着信息化水平不断提升,企业的审计工作需要处理海量的数 据,而利用常规软件难以对海量数据进行处理,这就需要应用大数据技术.审 计 ...

  9. 本地差分隐私 随机响应_大数据时代下的隐私保护

    本文作者程越强.孙茗珅.韦韬 1 引言 在大数据的时代,越来越多的服务和产品是围绕用户数据(隐私)建立的.这样虽然带来了个性化的服务,提高了服务质量和精度,但是在数据收集.使用以及公布的过程中,用户隐 ...

最新文章

  1. GO语言教程4:defer(延迟语句)详解
  2. oracle中asm磁盘不足,Oracle用户无法访问ASM磁盘组问题
  3. Win谷歌插件加载失效
  4. ASP.NET 开发者 开始学习ASP.NET Core 2吧
  5. “一边熬夜一边求不要猝死”,90后养生朋克指南,条条扎心!
  6. 【Gym - 101608G】WiFi Password (区间或,线段树 或 按位处理+尺取 或 二分)
  7. python字典导入mongodb_python连接mongoDB进行数据提取→常用操作指南
  8. LeetCode 434. Number of Segments in a String
  9. nginx ---- nginx.conf核心配置文件
  10. 爱因斯坦那颗大脑,究竟隐藏了什么
  11. 关于linux安装openoffice无法启动
  12. 根据crash学习用户空间程序内存布局
  13. VirtualBox虚拟机如何选中“启用嵌套 VT-x/AMD-V”
  14. SSh框架的整合流程
  15. 马蜂窝视频编辑框架设计及在 iOS 端的业务实践
  16. 非结构化数据分析技术是忽悠
  17. pdf转换成jpg python_Python Wand将PDF转换为JPG background
  18. python绘图之Times New Roman字体以及Helvetica字体
  19. 搜狗搜索立知问答合作说明
  20. 【微信测试版】支持安卓平板和手机同时登录

热门文章

  1. 简单的动画函数封装(1)
  2. 22 块级元素和行内元素
  3. hdu 4714 树+DFS
  4. 网页开发浏览器兼容性问题
  5. EditText 空指针问题
  6. Class.getResource和ClassLoader.getResource
  7. HTML渲染过程详解
  8. THYMELEAF 如何用TH:IF做条件判断
  9. 检测raid类型和磁盘坏道脚本
  10. tracert路由检测命令使用方法