深度学习:让电脑像人一样看世界

发表于2015-08-28 09:33| 5269次阅读| 来源NDTV Gadgets| 4 条评论| 作者Gopal Sathe

云计算人工智能深度学习
width="22" height="16" src="http://hits.sinajs.cn/A1/weiboshare.html?url=http%3A%2F%2Fwww.csdn.net%2Farticle%2F2015-08-28%2F2825564&type=3&count=&appkey=&title=%E5%AF%B9%E4%BA%8EBlippar%EF%BC%8C%E5%85%B6%E5%88%9B%E5%A7%8B%E4%BA%BAOmar%20Tayeb%20%E8%A1%A8%E7%A4%BA%E5%85%B6%E7%9B%AE%E6%A0%87%E6%98%AF%E5%B0%86%E4%BB%BB%E4%B8%80%E7%85%A7%E7%9B%B8%E6%9C%BA%E5%9D%87%E8%BD%AC%E5%8F%98%E4%B8%BA%E6%99%BA%E8%83%BD%E8%AE%BE%E5%A4%87%EF%BC%8C%E4%B8%8D%E8%AE%BA%E5%85%B6%E8%BF%9E%E6%8E%A5%E4%BA%86%E9%AB%98%E7%AB%AF%E6%99%BA%E8%83%BD%E6%89%8B%E6%9C%BA%E4%B8%8E%E5%90%A6%E3%80%82%E6%88%91%E4%BB%AC%E5%8F%AA%E9%9C%80%E8%A6%81%E4%B8%80%E4%B8%AA%E4%B8%8D%E4%BD%8E%E4%BA%8E2%E6%88%963%E5%85%86%E5%83%8F%E7%B4%A0%E7%9A%84%E7%9B%B8%E6%9C%BA%E5%8D%B3%E5%8F%AF%E4%BB%A5%E5%AE%8C%E6%88%90%E6%89%80%E6%9C%89%E7%9A%84%E5%B7%A5%E4%BD%9C%E3%80%82%E6%89%80%E6%9C%89%E7%9A%84%E2%80%9C%E6%80%9D%E7%BB%B4%E2%80%9D%E9%83%BD%E5%9C%A8%E6%88%91%E4%BB%AC%E8%BF%99%E8%BE%B9%E3%80%82&pic=&ralateUid=&language=zh_cn&rnd=1442496130240" frameborder="0" scrolling="no" allowtransparency="true">摘要:对于Blippar,其创始人Omar Tayeb 表示其目标是将任一照相机均转变为智能设备,不论其连接了高端智能手机与否。我们只需要一个不低于2或3兆像素的相机即可以完成所有的工作。所有的“思维”都在我们这边。

谷歌的 DeepDream——一个可以帮助人们了解神经网络的可视化工具——这不仅是当前十分火热的项目,这在一定程度上凸显了图像识别领域所面临的挑战。图像处理显然不是简单地将一幅图片与数据库相对比得出结果那么简单。实际上,图像处理是一个很复杂的问题。世界上有很多大公司正在图像处理上面大展拳脚。

NDTV Gadgets(一家媒体)对Omar Tayeb十分关注,当时这位Blippar (扩增实境公司)的创始人兼CTO连同合伙人兼CEO Ambarish Mitra正从位于英国的公司办事处出发一道访问Delhi,同时NDTV Gadgets也了解了blippar是如何理解图像识别的概念,对其运作原理有了基本的认识。

Blippar连同其他创业公司,比如Wowsome 和Times Internet's Alive公司,对AR的使用主要集中在市场营销方面。Alive推出了智能婚礼卡片,与此同时其他公司,在杂志和报纸广告,也试图使用AR,电子商务网站同样利用其作为虚拟购物体验。

然而,事情才刚开始,Mitra告诉NDTV Gadgets:“现在,当你启动Blippar应用程序时,它不会告诉你前方有个椅子,或者是你的桌上有个苹果,但它能识别出一瓶可乐【可口可乐】,也可以识别一个运动品牌或者其他类似的物体。”

在未来的5-6个月里,Blippar将会推出一个“视觉网络”,在该网络中,Blippar应用程序将能够识别目录中不必要的对象,并显示用户这些对象的相关信息。

“如果你看一辆车,即使在此之前你从来没见过那种型号,你也能够说出它是哪一种车型,”Blippar的CTO Omar Tayeb说到,“ Blippar现在还不能做到那样。它必须在此之前已经了解此类型的车,然后才能识别,否则将不会识别出。”

“这是一个极限,但通过深度学习,在迭代的过程中,系统确实开始学习,”他解释到。“机器学习意味着系统所知道的越多,它最终就变得越精确。这有点像婴儿的学习—作为婴儿你会看到数以百万计的不同面孔,从而使得你学会识别面部特征。该系统是用相同的方式,当越多人使用它时,它就会变的越发智能。”

从本质上讲,这个过程有它的基础,称之为模式识别。为此,计算机把图像分成若干层,然后尝试着从这些集合中去识别个体数据,而非识别整个图像。这有点像搜索引擎———你输入越多的检索词,你得到的结果越准确,根据Tayeb所说,模式识别的目标是将图像打破成足够多的数据点,以便在问题中建立一个很容易理解的认识对象。

“显然,你不可能拥有一个包含所有你需要的图像的数据库,”Tayeb说“所以仅能识别特殊图像是远不够的;你需要能够看到它然后说出这是一把椅子,而不是只识别一个特定的椅子。

机器学习比模式识别更进一步,它尝试用逻辑分组的模式,以便更快速、更准确地识别对象。通过使用大量的复杂的数学公式,计算机正在通过机器学习而变得更为聪明,但是再进一步,使计算机更加接近人类的思维方式,就是所谓的深度学习。

这些也被描述为神经网络,它们以神经元命名,因为这些系统(特别是大脑)是建立在动物的中枢神经系统的基础上。神经网络就是让电脑以人类的方式思考问题, Tayeb 解释道。

“没有目录——这是不可能的-所以你必须提取出来结构。这也是人类大脑所做的,”他解释到。“当你看到某些事物时,你的眼睛中的会接受大量的数据,但数据对眼睛本身来说没有任何意义。你的大脑必须处理你眼所接受的9-10百万数据点,来判断这些对象是如何形成的,在分析这些对象是什么、并判断出它们的属性。”

2014年,微软、谷歌和Facebook均发布了各自的图像识别软件。从中你就可以发现不同公司对图像识别的侧重点存在差异——用过Picasa和Facebook的人会对其软件中的标记功能印象深刻;相对而言谷歌和必应在识别图像上做的更加出色。如果你阅读了这三家公司关于这方面的相关研究文献,你就会了解他们是如何利用神经网络的-------多次遍历原图像以便确认其图像身份的。深度学习是实现这样一个过程的基础前提。

他补充道:“对我们来说,这款APP的核心在于收集数据,无论何时你因为这样或那样的原因打开这款App的同时,数据就已经自动存入了。它从你看到的每一件事开始学习。首先,他可能需要人工识别。一旦有足够的用户显示给他椅子并告诉它这是椅子时,这个过程就变得自动了。然后这款App开始能够自行识别凳子甚至于没有任何提示。这同样适用于其他对象。在某个时候,你可能会得到一个苹果,然后得到它的营养数据,或看到一个电话,可以看到你能在哪里购买。”

对于Blippar,Tayeb 解释道:目标是将任一照相机均转变为智能设备,不论其连接了高端智能手机与否。我们只需要一个不低于2或3兆像素的相机即可以完成所有的工作。所有的“思维”都在我们这边,因此也就不存在其他限制,我们想要得到的结果是其能成为任一相机的“大脑”。

深度学习:让电脑像人一样看世界相关推荐

  1. 漫画笔记--深度学习,能让人一图看懂,通俗易懂

    漫画笔记--深度学习,能让人一图看懂,通俗易懂!! 漫画笔记--深度学习,能让人一图看懂,通俗易懂!! 漫画笔记–深度学习,能让人一图看懂,通俗易懂!! 这本漫画笔记很有意思,非常适合初学者学习.除非 ...

  2. 自行装配适合深度学习的电脑

    原文链接:https://www.oreilly.com.cn/ideas/?p=903 是的,你可以在一个39美元的树莓派板子上运行TensorFlow,你也可以在用一个装配了GPU的亚马逊EC2的 ...

  3. 学习神经网络(深度学习)电脑的配置要求

    学习神经网络(深度学习)电脑的配置要求 个人电脑配置与使用感受(电脑小白) 我目前所使用的电脑的配置是 (1)CPU:i5-9300H (2)显卡(GPU):GTX1650-4G(4G表示显存) (3 ...

  4. 马尔奖得主 Alan Yuille | AI 视觉的未来:像人一样看世界

    ‍‍ 智源导读:人类的视觉系统经过百万年的进化已具有非常强大的功能,甚至是一种未受到充分赏识的超能力.人类之所以在视觉上表现如此优异,一方面归功于人类的进化史,另一方面是因为我们的大脑投入了很大一部分 ...

  5. 一文搞定深度学习入门级电脑硬件配置

    对于刚接触深度学习的学友而言,可能都会碰到电脑配置的问题,比如显卡型号.内存容量.处理器型号等.好的电脑配置,比如GPU加速的显卡,是能够有效缩短算法的训练时间的,这能让人尽快的看到算法的结果,也便于 ...

  6. 本穷鬼攒的一台用于深度学习用电脑

    本人穷困潦倒,屋子小,钱少. 最近在闲鱼上攒了一台深度学习用的电脑.全部二手,一共花了10400. CPU,9700k.  9700我估计应该也没问题. 板子 z390p.  这个板子给i7的cpu超 ...

  7. 飞桨深度学习开源框架2.0抢先看:成熟完备的动态图开发模式

    百度飞桨于近期宣布,深度学习开源框架2.0抢先版本正式发布,进入2.0时代.其中一项重大升级,就是推出更加成熟完备的命令式编程模式,即通常说的动态图模式.同时在该版本中将默认的开发模式定为动态图模式, ...

  8. 如何搭建一台深度学习的电脑工作站

    如何给自己搭建一台深度学习工作站? 这个是很多刚准备入门的同学疑问,那么我们今天就来讲解下如何搭建. 有多种典型配置,一个 GPU 的机器.两个或四个 GPU的机器.如果您需要更多GPU,请考虑配置两 ...

  9. 深度学习--识别(四小人)人物图像

    岁月匆匆如流水,青春一去不回头.近2年来,随着AI等技术的发展,目前深度学习对图像,语音,文字等已经比较成熟,我也来跟跟风,拿人物图像练练手. 下面是我采用的是DenseNet卷积神经网络模型来训练 ...

最新文章

  1. 美团Java面试154道题分享!
  2. R语言使用ggplot2包使用geom_boxplot函数绘制基础分组缺口箱图(notch boxplot)实战
  3. 失败 安装scikit_scikit-learn0.22版本最新发布
  4. java 小波去噪原理_小波去噪的基本知识
  5. oracle 结果缓存,Result cache结果缓存
  6. 异常详细信息: System.Data.SqlClient.SqlException:用户 ‘IIS APPPOOL\DefaultAppPool‘ 登录失败解决办法
  7. python使用itchat获取微信好友列表
  8. diff命令两个服务器文件,LINUX命令diff-文件管理-比较给定的两个文件的不同
  9. C# Excel 读写数据
  10. Windows系统清理随记
  11. STL两种格式:文本格式与二进制格式
  12. ArcGIS按属性选择多个地类
  13. 微信服务号使用微信支付
  14. MySQL 性别为什么不适合建立索引-值重复率高的字段不适合建索引【转载】
  15. linux设置display参数,Linux DISPLAY 变量设置
  16. Unity 游戏数据的存档读档,数据加密与解密
  17. 博日科技招股书失效,中金公司已停止对其辅导,放弃港交所上市?
  18. html5 ogv格式转换,ffmpeg – Mac上的HTML5视频OGV转换
  19. 从零开始之uboot、移植uboot2017.01(五、board_init_f分析)
  20. 简单聊聊消息队列的事务补偿机制

热门文章

  1. 边框回归的损失函数_一文搞懂常用的七种损失函数
  2. 激光点云感知 voxnet本质
  3. 人体姿态估计 自顶向下与自底向上
  4. Python Elasticsearch 插入数据
  5. pyspark pipline
  6. Python center 用法
  7. 基本符号有_MapGIS 10中各种比例尺、符号尺寸计算说明(三)——随图缩放的符号计算...
  8. 强化学习(五)用时序差分法(TD)求解
  9. (精简)Spring框架的IoC(替代工厂类实现方法)和AOP(定义规则,约定大于配置)
  10. ai作文批改_全球第一份机器人批改的作文 阿里AI批改中文试卷