20201014 《计算感知》第2节课 笔记
目录
- 导论
- David Marr的视觉计算理论
- 信息处理的三个层次
- 视觉表示框架
- 一些书籍(Marr吹)
- 计算机视觉研究的五大研究分支
- 计算机视觉的应用
- 视觉的特性
计算视觉
导论
认知 谋划 行动,三个层次,认知能力欠缺
思考 阅读 交流 实现,四个步骤,缺少交流
David Marr的视觉计算理论
- 1945-1980,英年早逝
- 论文推荐 Cooperative computation of stereo disparity, Science
- 论文推荐 Theory of edge detection
- this book is meant to enjoyed 这本书意味着一种享受
信息处理的三个层次
- 计算理论
收款机做的是算数运算,涉及到加法理论。
收款机计算理论:①不买物不付钱(零规则)②价格输入顺序不影响总价格(交换律)③分批输入价格不影响总价格(结合律)④退货后支出是零(反数)
计算策略:以6×9-2×6为例。策略①54-12=42。策略② 6×(9-2)=42 - 表示和算法
- 硬件实现
视觉表示框架
- 第一阶段 以原始图像为输入,抽取边缘、纹理等基本特征,称为基元草图
- 第二阶段 以原始图像、基元草图为输入,以观测者为中心,抽取深度信息,但不是真正的物体三维表述,称为二维半草图
- 第三阶段 以原始图像、基元草图、二维半草图为输入,以物体为中心,恢复、表示和识别三维物体
一些书籍(Marr吹)
- 《惊人的假设——灵魂的科学探索》汪云九 译
- 《认知科学导论》 章士嵘 人民出版社 1992
- 《认知心理学》 梁宁建 上海教育出版社 2003
- 《心智、大脑和计算机——认知科学基础导论》 RM哈尼什 浙江大学出版社 2010
- 《认知神经科学:关于心智的生物学》 GazzanigaMS 中国轻飞业出版社 2011
计算机视觉研究的五大研究分支
- 输入装置
计算摄像学,研究成像装置和数字化装置。 - 低层视觉
对原始图像加工和处理,提取图像的基本特征,还包括图像变换(矫正)、纹理检测等。 - 中层视觉
恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息。实现的途径有:立体视觉、测距成像、运动估计等。 - 高层视觉
恢复物体的完整三维图,建立三维描述,识别三维物体并确定物体的位置和方向。 - 体系结构
在高度抽象的层次上,根据系统模型而不是实现设计的具体例子来研究系统的结构。体系结构研究涉及一系列相关的课题:并行结构、分层结构、信息流结构、拓扑结构以及从设计到实现的途径。
计算机视觉的应用
视觉的特性
- 错位性
- 整体性
- 恒定性
- 视动性
- 多感知通道的相互影响
麦格克McGurk效应
20201014 《计算感知》第2节课 笔记相关推荐
- 数据结构与算法XS班-左程云第一节课笔记(位运算、算法是什么、简单排序)
第1节 位运算.算法是什么.简单排序 ##这是数据结构与算法新手班-左程云第一节课的笔记## 1. 位运算 // 你们会不会表示一个数字的32位啊? // Java中int类型默认以32位二进制数在计 ...
- 20201010《近代数学》第1节课 笔记
目录 线性空间和距离空间 书籍推荐 映射 数学特性 十一调课,今天应该上周四的课,但是后来听说周六的课也正常上,结果错过了2.5节课... 线性空间和距离空间 线性空间:数列的收敛 ∀ε,∃n> ...
- 比特鹏哥第二节课笔记
c语言第二节课 使用部分c语言库的时候vs2010会提醒 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HECFY2ou-1649683114214)(C:\Users ...
- 20200930 《计算感知》第1节课 笔记
目录 为什么开这门课 倡导5A 算法的层次 推荐书籍 人类智能 图像处理与计算机视觉 一些期刊和会议 为什么开这门课 认知:不忘初心 方法论:①自上而下,现有理论,后有实验.②层级法. 计算思维方式: ...
- 20201202 《计算感知》武老师 第2节课 笔记
目录 Rob Fergus Kevin Murphy Antonic Torralba Andrew Zisserman Alan Yuille Olivier Faugeras Martial He ...
- 20201125 《计算感知》武老师 第1节课 笔记
目录 美国知名学者 欧洲知名学者 华人知名学者 AI的发展得益于 做好一个topic一定要读的三篇论文 美国知名学者 MIT,Marr的两大弟子,Marvin Minsky(图灵奖).Tomas Po ...
- 20201028 《计算感知》第4节课 笔记
目录 Human Activity Analysis people understanding的四个level 应用 Challenges Human Activity Analysis people ...
- 20201021 《计算感知》第3节课 笔记
文章目录 边缘检测(Edge Detection) 边缘检测 一阶微分算子 二阶微分算子 立体视觉(Stereo Vision) 计算机视觉最难的两个问题 视差.外极面.外极线.外极点 边缘检测(Ed ...
- 20201014 《人工智能与大数据》第1节课 笔记
目录 课程相关 推荐书籍 在n个数中查找出现次数超过一半的数字 在n个数中寻找出现次数最多的k个数字 估计n个数中出现次数最多的k个数字的出现次数 布隆过滤器 课程相关 李荣华 lironghuabi ...
最新文章
- python爬取网页上的特定链接_python3下scrapy爬虫(第三卷:初步抓取网页内容之抓取网页里的指定数据)...
- python语言入门w-Python 基础教程
- ie8不兼容java项目_[Java教程]ie8以下不兼容document.getElementsByName解决方法
- 谷歌大脑科学家亲解 LSTM:一个关于“遗忘”与“记忆”的故事
- Ruby备份mongodb(fsync lock)
- RTS寻路相关资料收集
- 确保已在无线网络上启用dhcp服务器,WiFi无线网络提示未启用DHCP无法上网的解决方法教程[多图]...
- 线程的生命周期图(附多线程)
- configure: line syntax error near unexpected token `win32-dll'
- Root Pane Container(三)
- Java中继承方法的使用,以及使用方法的注意事项,继承方法重写的理解,白话文详解,简单易理解
- modelsim 波形设置显示时间单位
- Python LeetCode 数组中的最长山脉
- 模电基础-1:分立器件
- weight decay
- 收到短信:【淘会员】加微信免费赠礼品!是什么套路?这类短信如何发
- python 二进制的数为啥带0b?,怎样去掉0b?
- 超时空智慧办公白皮书(2023)
- not executable: 64-bit ELF file 已解决
- PMP考试可以自学吗?
热门文章
- 用ConfigParser模块读写conf配置文件
- android bitmap 饱和度 demo,Android GPUImage实现多种图像滤镜效果
- jsp可以使用iframe_使用 JavaScript object URLs,可以处理图像、音频和视频
- QFileDialog::getOpenFileName
- javascript中变量的判断
- 结构体:计算学生平均分
- 两个数从大到小排列输出
- 关于jquerymobile的预加载
- x86分页机制——《x86汇编语言:从实模式到保护模式》读书笔记42
- SpringBoot项目优化和Jvm调优及VisualVM远程连接监控JVM(JMX连接)