UCAS-AI学院-计算机视觉专项课-第1讲-课程笔记

  • 课程介绍
  • 什么是计算机视觉
  • 计算机视觉发展的四个重要历程

课程介绍

  • 线上讲授+答疑
  • 编程作业+文献阅读作业 30%
  • 课堂开卷 70%

什么是计算机视觉

  • 视觉:通过看来明白那是什么(To know what is where by looking)
  • 感知的用途:
    • 适应环境
    • 控制行动
  • 计算机视觉:研究视觉感知的学科
  • 感知:对感受信息的解析
  • 认知:获取知识的过程
  • 感知的核心科学问题:表达和解释(并非理解)
  • 计算机视觉的莫表:构建一个像人的视觉系统一样具有通用性和灵活性的计算机视觉系统
  • 计算机视觉:从图像到三位场景表达
  • 计算机图形学:从三维场景表达到图像
  • 视觉知识表达:图像、视频、语音——视觉概念与概念之间的关系——推理

计算机视觉发展的四个重要历程

  • 马尔计算视觉理论

    • 计算视觉理论:对图像信息的逐层加工处理过程
    • 三个层次
      • 计算理论层次
      • 表达与算法层次
      • 算法实现层次
    • 视觉感知主要目标:从图像逐层构建物体的三维形状表达(三维重建)
      • 计算理论——三维几何描述
      • 表达层次——三层表达(图像——基元——2.5D(观察者坐标系)——3D(物体坐标系表达))
        • 基元表达——计算可见表面信息——集成曲面深度、朝向、轮廓等信息——物体坐标系形状表达
      • 算法层次——边缘提取、立体匹配
      • 实现层次——神经计算或计算机
    • 生物视觉主流观点认为深度信息不必要
    • 人类视觉包含物体视觉和空间视觉,后者更需要三维形状信息
    • 概念时推理的基础,三维形状信息也是组成概念的一部分
  • 主动视觉大辩论
    • 对马尔视觉理论的质疑和批评——从下到上的理论,缺乏高层知识反馈指导,缺乏木钉刑和主动性
    • 目的性和主动性可以融入到马尔的计算视觉框架
    • 主动视觉的困难:注视和反馈
  • 分层三位重建理论
    • 分层重建:图像——射影重建(保持直线)——仿射重建(保持平行)——欧氏重建(保持垂直)
    • 优势:每步涉及的优化变量少,重建的鲁棒性高
  • 基于学习的视觉
    • 子空间方法(流形)

      • 高维数据在低维空间可以实现聚类
    • 深度学习方法
      • DNN:层叠结构表达力强,感受野数据驱动
      • 物体识别——场景理解(图像——视频)
      • 前馈网络——反馈网络 / 循环网络
      • 深度网络可解释性
  • 马尔三维冲概念理论:识别物体,大脑要有对物体的表达,即三维形状
  • 巴乔的二维图像模型:大脑对物体的表达是一组不同姿态下的二维图像特征
    • Hmax模型
  • 迪卡洛的分层去纠缠理论:层次化处理,逐渐去除与物体类别无关的干扰信息,达到线性空间具有可分性的物体表达(流行学习思想)
    • Untangling模型
  • 猜想:物体识别的逆生成模型
    • 从图形逐层回复生成图像的参数(姿态、光照、几何、纹理……)
    • 图像——逆变换模型——图像生成参数——图像生成模型——图像

UCAS - AI学院 - 计算机视觉专项课 - 第1讲 - 课程笔记相关推荐

  1. UCAS - AI学院 - 知识图谱专项课 - 第8讲 - 课程笔记

    UCAS - AI学院 - 知识图谱专项课 - 第8讲 - 课程笔记 关系抽取 概述 面向非结构化文本的关系抽取 预定义关系抽取 开放式关系抽取 面向半结构化文本的关系抽取 数据和评测 关系抽取 概述 ...

  2. UCAS - AI学院 - 自然语言处理专项课 - 第7讲 - 课程笔记

    UCAS-AI学院-自然语言处理专项课-第7讲-课程笔记 形态分析.汉语分词与词性标注 概述 英语形态分析 汉语自动分词 概要 性能评价方法 未登录词识别 现状和未来 词性标注 形态分析.汉语分词与词 ...

  3. UCAS - AI学院 - 自然语言处理专项课 - 第8讲 - 课程笔记

    UCAS-AI学院-自然语言处理专项课-第8讲-课程笔记 句法分析·短语结构分析 概述 线图分析法 CYK分析法 基于PCFG的分析法 句法分析性能评估 局部句法分析 句法分析·依存句法分析 概述 依 ...

  4. 【人工智能】AI技术人才成长路线图;深度学习课程笔记

    人工智能浪潮来袭,开发者应该怎么办?不久前,在"AI生态赋能2018论坛"上,CSDN副总裁孟岩重磅发布了AI技术职业升级指南--<AI技术人才成长路线图>(V1.0) ...

  5. 七月在线--金融风控实战--第二课 风控数据挖掘方法--课程笔记

    决策树的定义: 分类决策树模型是一种描述对实例进行分类的树形结构.决策树由结点(node)和有向边(directed edge)组成.结点有两种类型:内部结点(internal node)和叶结点(l ...

  6. 这个AI学院取名黄埔,30%学生都是CTO/技术总监,没有落地成果不许毕业

    郭一璞 发自 后厂村  量子位 报道 | 公众号 QbitAI 要学人工智能? 吴恩达的课,李宏毅的课,斯坦福/CMU的课,都是大家的最爱. 它们或通俗易懂,或易于入门,对AI初学者.计算机专业学生们 ...

  7. 【AI学院】有三AI博士小姐姐带你学深度学习之图像识别下篇,附上篇回顾

    带学营第一期(上)圆满结束回顾 有三 AI 深度学习之图像识别带学营第一期(上)圆满结束,这一期我们主要的培训内容是深度学习基础+项目实战(人脸表情识别和鸟类细粒度识别). 以上的课程可以说是干货满满 ...

  8. 人民大学的AI学院,教师团队很凡尔赛

    金磊 蕾师师 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最高年薪180万,还有400万房补. 去年,人民大学高瓴人工智能学院招聘启事一经发布,业内外热议. 现在时隔一年之久,在具备如此吸引 ...

  9. Coursera-吴恩达-自然语言处理(NLP)专项课-课程笔记与编程实战-汇总

    1.介绍: 本文主要基于Coursera上deeplearning.ai的课程 自然语言处理 专项课程(Natural Language Processing Specialization),将全部课 ...

最新文章

  1. 关于Linux前后台程序切换
  2. python培训机构推荐-Python培训班哪家好?老男孩Python入门学习
  3. 前端调试工具Browser-sync(Windows)安装指南
  4. 蓝桥杯第五届决赛真题大全解(java版本)
  5. Python教程:多变量的灵活处理
  6. android 访问https服务器
  7. 在.NET Core中使用MongoDB明细教程(3):Skip, Sort, Limit, Projections
  8. Visual Studio 中 Tab 转换为空格的设置
  9. GNU Radio 之 rtl-sdr
  10. python一元线性回归算法_Python机器学习(二):线性回归算法
  11. MyCat全局序列之本地文件方式
  12. 系统集成项目管理工程师14 总结
  13. 用计算机遥感技术图片,遥感图像处理
  14. 谷歌地球到底有多厉害?附查看高清卫星影像方法
  15. 130个资源网站,总有一个你用得着
  16. 十二黄金圣斗士阴险程度(爆笑)
  17. FinalReport连接MYSQL数据库失败经验分享
  18. 【自由探索】决策树归纳
  19. EasyNVR使用Onvif探测设备失败,显示“无数据”是什么原因?
  20. KEIL封装lib库文件

热门文章

  1. Excel:创建级联下拉菜单
  2. C语言 三种链接属性(external、internal、none)的浅析
  3. AI认知架构四十年:发展与挑战
  4. 通过PubSubHubbub实现YouTube订阅功能
  5. 动手实现简易网站目录扫描器——WebScanner
  6. python蟒蛇编程_蟒蛇(Python)——欧美最容易学习的编程语言
  7. 北师大 外国教育史-5(各国教育)
  8. 阿里云架构师梁旭:MES on 云盒,助力客户快速构建数字工厂
  9. 细节决定了整个人的简约气质
  10. linux设置密码报错automa,AutomaThemely:根据太阳日出及日落时间自动切换明暗的Gtk主题...