开启AI世界的大门 —— 从人工智能到计算机视觉

目录

  • 开启AI世界的大门 —— 从人工智能到计算机视觉
  • 1. 关于人工智能
    • 1.1 初识人工智能
    • 1.2 人工智能的三大核心要素
    • 1.3 人工智能关系圈
  • 2. 计算机视觉(Computer Vision)
    • 2.1 初识CV
    • 2.2 深度学习与CV及CV的应用

1. 关于人工智能

1.1 初识人工智能

第一件事情,我们要先知道人工智能的基本概念,到底什么是真正的人工智能,在学术界有很多种表述方式,但是有一条被广泛接收的说法:人工智能是通过机器来模拟人类认知能力的技术。人工智能是当今计算机世界中的热门中的热门领域,它涉及了很多很多领域,涵盖了感知、学习、推理与决策等方面的能力

从实际应用的角度来说:人工智能最核心的能力就是根据给定的输入作出判断和预测

人工智能AI是什么时候诞生的呢?迄今为止它的发展经历了哪些阶段?这些就是我们需要关注的东西,让我们来串一串时间线,1955年达特茅斯会议标志着AI的诞生,这一年史称AI元年,AI世界的大门终于开始正式被人类探索,它将伴随人类文明走过很长很长的一段历史,在AI发展的过程中有过三次黄金期,而每一次的黄金期都是由于某一种新的概念或算法被提出

  • AI的第一个高峰及低谷:1957年罗森布拉特发明了第一款神经网络Perceptron,由此AI进入了第一个高峰期,1970年由于计算能力突破没能使及其完成大规模数据训练和复杂任务,由此AI进入了第一个低谷
  • AI的第二个高峰及低谷:1982年霍普菲尔德神经网络被提出,四年后1986年BP算法出现使得大规模神经网络的训练称为可能,这两次历史性的突破将AI推向了第二次高潮,大在1990年,AI计算机DARPA没能实现预期的效果,没能得到更多的资金支持,所以刚刚兴起的AI浪潮又一次进入低谷
  • AI的第三个高峰直至今天:2006年**Hinton提出了"深度学习"**神经网络使得人工智能性能得到了关键性的突破,2013年深度学习算法在语音和视觉识别上取得突破,由此AI进入了新的时代——感知智能时代

人工智能发展的基石——图灵测试

图灵测试是人工智能领域相当重要的一个概念,图灵测试的过程包括了3方:测试者、被测试者和机器,测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问,进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能但是这不是绝对的,不是说一台机器只要通过了图灵测试,它就是人工智能,图灵测试只是一个非常非常重要的参考和标准,要认定一台机器的人工智能,还需要很多方面的评判

1.2 人工智能的三大核心要素

人工智能的三大核心要素:数据、算法、算力

数据

人工智能的要素之一——数据,指的就是我们输入机器的数据,而机器根据我们的输入数据作出相应的判断和预测,随着互联网物联网的发展,关于整个世界的信息和数据越来越多,这为人工智能提供了足够丰富的,源源不断的营养,使得机器有足量的数据去学习,然后再反馈我们想要的结果

大数据技术的核心就是利用了数据的价值,机器学习就是利用数据价值的关键技术

算法

我们为机器提供数据之后,机器也只是拿到了数据仅此而已,更关键的就是算法,算法的概念非常简单,当我们交给计算机一个任务时,不但要告诉它做什么,还要告诉它怎么做,而算法就是关于"怎么做"的一系列指令

算力

算力就是帮助电脑快速运行、快速处理图像的一些硬件设施,例如CPU、GPU和NPU(深度学习加速器)等硬件设施,这些硬件设施就是实现算法的关键,使算法的实现迅速且准确

算力的突破——传统CPU与新兴运算加速技术+智能芯片

关于CPU与GPU之间的关系我们可以简单理解为:CPU + 并行计算 = GPU,而GPU在造好了之后是不能进行改装的,这个时候出现了FPGA来解决我们硬件设计的问题,它在造好之后用户是可以随时修改的,这就大大降低了开发的风险

还有一个很重要的概念我们需要了解一下:分布式运算,如果每一台计算机都是一个模块,所有的计算机按照一定规则分配任务后分头运算,最后再把计算结果汇合起来,这就是分布式运算

(图片来源于八斗人工智能——八斗学院王小天)

1.3 人工智能关系圈

在人工智能的发展历程中,具有里程碑意义的是机器学习的兴起和深度学习的突破,他们之间与人工智能之间有什么关系呢?人工智能关系圈是带领我们了解AI世界最重要的领航员

机器学习——一种实现人工智能的方法

机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及了所有人工智能领域,它主要使用归纳、综合而不是演绎

深度学习——一种实现机器学习的技术

深度学习是利用深度的神经网络,将模块处理得更复杂,从而使模型对数据的理解更加深入,是机器学习中基于对数据进行表征学习的方法,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本

深度学习的实质,是通过构建具有很多隐层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性

人工神经网络——一种机器学习的算法

神经网络一般有输入层->隐藏层->输出层,一般来说隐藏层数量多于两层的神经网络就叫做深度神经网络,深度学习就是采用像深度神经网络这种深层架构的一种机器学习方法

机器学习是为了实现人工智能,深度学习是机器学习的一种

经典的机器学习过程

首先要准备训练数据(包括了很多类别标记label,也就是一些最能代表此类事物的特征集合),然后我们要根据我们想要的需求,去设计学习算法,使用学习算法训练好数据后就变成了我们的一个模型(例如决策树、神经网络等),我们将新数据样本(预测数据)传入模型后,模型会根据它学习过的能力,来给我们反馈数据

了解神经网络(人类的思考——生物神经网络)

人类的神经网络所能完成的事情大概可以解释为:在收到外部刺激后,神经元会将这个刺激转化为信息来传递给其他功能细胞,这些细胞在接收到这些信息后会作出相应的输出

人工神经网络就是模拟生物神经网络来建立的一种网状结构,其中的每一条神经元首先要有输入数据(刺激),还要有接收和处理这些数据的一个感知器,最后再作出输出,这些神经元交叉混合在一起,就形成了我们的人工神经网络,人工神经网络的逻辑结构包括:输入层、隐藏层和输出层,其每一层的功能就是我们上面所说的过程,这些过程相互配合和通信后,就可以实现我们想要的效果

但是隐藏层可不仅仅有一层,当人工神经网络具有多个隐藏层是,它就被称为深度神经网络,基于深度神经网络的机器学习就是深度学习

2. 计算机视觉(Computer Vision)

2.1 初识CV

万剑归宗!在学习计算机视觉之前,我们要先了解什么是计算机视觉,用一句话来概括的话,计算机视觉就是让计算机拥有人能所见、人能所识、人能所思的能力,就可以称之为计算机拥有视觉,即计算机视觉!(需要注意的是,不仅要让计算机有"看"的能力,也要有"认"和"想"的能力)

2.2 深度学习与CV及CV的应用

基于深度学习的计算机视觉,就是让计算机视觉具备"识别"的能力,以达到人工智能的目的,那怎么让它具备这个能力呢?很显然就是使用机器学习,使得机器能识别图像,CV与AI、ML和DL是相交的一个概念,我们会使用机器学习深度学习来实现我们CV的功能

CV有5大应用:

1.图像分类(使用卷积神经网络CNN) —— 线性整流层RELU(函数f=max(0,x)) 和 池化层POOL(根据输入参数取得每一块儿部分的最大值)

2.目标检测(使用R-CNN) —— 提取感兴趣区域再进行ConvNet(卷积)

3.语义分割(使用FCN网络) —— 将不同类别的物体分割然后对其进行上色(面向的是大概的类别)

4.实例分割 —— 将不同实例的物体进行分割再上色(面向的是实例对象)


版权声明:以上学习内容及配图来自或参考自——八斗人工智能
如果文章对您有所帮助,记得一键三连支持一下哦~

开启AI世界的大门 —— 从人工智能到计算机视觉相关推荐

  1. ChatGPT:开启AI新纪元-人工智能AI

    报告地址:ChatGPT:开启AI新纪元-人工智能AI 随着人工智能技术的不断发展,越来越多的领域开始应用人工智能技术来提高效率和质量.其中,自然语言处理技术的应用尤为广泛,人们使用自然语言处理技术来 ...

  2. 一键开启次元世界,AI Studio应用中心上线啦!

    随着AIGC热潮如火如荼的发展,人工智能在越来越多的内容创意领域创造了丰富的交互体验,例如写作.绘画.编曲.视频等都显现出愈发明显的价值,频频带来令人赞叹的作品. 不论是内容娱乐行业,亦或是工业制造等 ...

  3. 【乘风破浪的开发者】丁一超:从AI实战营出发探索未知的AI世界

    摘要:从年初的不知不觉进入AI学习的道路,到认识并熟练使用ModelArts平台.虽然只有短短的半年,但这半年的探索学习,让丁一超看清了未来的路在何方. 从招聘网站上输入"人工智能工程技术人 ...

  4. 树莓派人脸识别_童话树莓派|(十一)进入AI世界人脸识别(防疫检测)

    童话树莓派 第十一集-进入AI世界-人脸识别(防疫检测) [人脸识别+口罩检测] 小朋友们,很快又见面了 今天我们继续进入AI人工智能世界,探寻人脸识别的奥秘 你看起来多少岁呢? 你看起来是男的还是女 ...

  5. 百度AI全面开放EasyDL开启AI普及化时代;讯飞翻译机2.0发布:支持34种语言;华为开发能读懂人类情绪的AI技术

    百度AI全面开放EasyDL开启AI普及化时代,"小白"也能用AI 百度"燎原计划2018"暨百度AI开发者实战营第二季强势回归,首站北京即放送三大满足各类开发 ...

  6. 多模态AI崛起,2022年人工智能5大发展趋势

    来源:CSDNnews 转自:中国机器人网 前言 国外一家专注于开源和堆栈技术新闻网站 TheNewStark 盘点出 2022 年值得人们期待的五个人工智能发展趋势. 随着深度学习的开放,人工智能在 ...

  7. 理解人类世界的常识对于人工智能是一项挑战

    来源:ScienceAI 常识并不常见,尤其是在人工智能方面.计算机很难做出人们认为理所当然的细微差别.这就是网站要求您在登录或购买之前验证您是人类的原因:大多数机器人无法分辨人行横道和斑马之间的区别 ...

  8. 谷歌 AI 中国中心成立,人工智能势不可挡?

    昨日,谷歌在上海举办了一年一度的Google中国开发者大会.在本届大会上,谷歌云首席科学家李飞飞宣布了一个重磅消息,即在北京将成立谷歌AI中国中心.对于这个即将成立的AI中心谷歌寄予厚望,希望与中国本 ...

  9. 《Science》杂志:机器学习究竟将如何影响人类未来的工作? 2018-01-11 Smiletalker AI科技评论 AI 科技评论按:人工智能、机器学习相关技术已经多次刷新了人们对于「计算机能

    <Science>杂志:机器学习究竟将如何影响人类未来的工作? 2018-01-11SmiletalkerAI科技评论 AI 科技评论按:人工智能.机器学习相关技术已经多次刷新了人们对于「 ...

最新文章

  1. spring+ (activeMQ) 实现queue与topic
  2. 整理一下linux系统expand 命令
  3. 浅谈Horizon DaaS平台 - 崛起的桌面云平台
  4. 详解ISA2006三种客户端
  5. 单目视觉标定:世界坐标系、相机坐标系、图像坐标系、像素坐标系——简单粗暴,粗暴
  6. 基于.NetCore3.1搭建项目系列 —— 认证授权方案之Swagger加锁
  7. linux系统怎么安装pr,Linux安装后的配置
  8. python实现嵌套功能_我应该如何在Python中实现“嵌套”子命令?
  9. [原]用好注册表,加固系统和发现病毒
  10. python函数参数用法_Python:函数参数类型及其用法
  11. 单片机IC卡读取开题报告_基于单片机的IC卡读写器设计(含开题报告)
  12. win10 计算机右键管理,win10系统右键菜单管理的步骤介绍
  13. 谷歌浏览器---日常使用设置
  14. L298N和TB6612FNG模块控制直流电机
  15. 【未完成】7-7 新浪微博热门话题 (30 分)
  16. android计算器退格键,请问下计算器的退格键是哪个键?
  17. 奇迹MU虚拟机 游戏多开无法登陆和登录错误的问题如何解决?
  18. java 模拟火车站售票系统_模拟售票系统java编程
  19. CS61A fa2021 Composing Programs 2.7 Object Abstraction 对象抽象
  20. 中行安全控件可致 Win8 笔记本键盘失灵

热门文章

  1. 深度解读:《数字孪生世界白皮书(2023)》全方位剖析
  2. (一)SQL语言_数据库_学习笔记
  3. cv岗工作做什么_你去面试的这个职位的描述(JD)≠你的个人履历(CV)
  4. hpoem系统服务器,hp(惠普)Windows 7 32/64位-OEM版
  5. 为什么电源纹波那么大?
  6. 安装运行Hyperf
  7. Sigcomm2017 Credit-Scheduled Delay-Bounded Congestion Control for Datacenters 论文阅读
  8. 网络未能解析服务器名,未能解析此远程名称局域网服务器
  9. 为什么地球的生物都是碳基生命?科学家:大自然环境选择的结果
  10. 如何用Autojs写自己的卡密验证界面?实战代码