AI实训营笔记【6.11更新至笔记7】
- 5.31开营
- 需要交至少3次作业(共5次)
- 算法库
- MMOCR 文字检测库
- 提取结构化信息
- MMDetection3D
- MMRotate 旋转目标检测
- 图像分割算法库
- 图像分割是识别提取的
- 图像分类+预训练+多模态 MMPretrain
- 图像分类(Image Classification )图像描述(lmage Caption )视觉问答( Visual Question Answering )
- 视觉定位(Visual Grounding )检索(Retrievallmage-To-lmageText-To-lmagelmage-To-Text)
- 姿态
- MMOCR 文字检测库
- 感觉做CV会涉及到各行各业 生物 交通 农业 机械....
6.1课程
人体姿态估计 MMPose包
讲师:卢策吾老师
中文文档:欢迎来到 MMPose 中文文档! — MMPose 1.0.0 文档
(课后要自己看一看中文文档)
2d姿态估计:
自顶向下:先确定人体
基于回归:对关键点的位置进行概率建模
基于热力图的建模
自底向上:先找关键点 再聚类
找关节
多人姿态估计
3d姿态估计:
人体参数表面化,将人体表面划分为24块...
思考:涉及算法的地方不是特别懂,但是一定要多思考搞清思路和用途,再找到对应的包的操作方法和代码,会用再说
6.2课程
子豪(b站有号):MMPose 代码教程
https://www.bilibili.com/video/BV1Pa4y1g7N7
https://www.bilibili.com/video/BV1Lm4y1879K
https://www.bilibili.com/video/BV12a4y1u7sd
先进行环境配置+安装
(学员手册里有个demo:
- 学员手册-环境配置 6.4已经看完并操作完
conda activate openmmlab
激活虚拟环境
进度:目前操作了MMPose 和MMdetection 包安装,没有太大问题。后两个检测三角板的实践的视频还没来得及看,希望明天能赶紧补上做好作业……
思考:没有太多思考因为内容没看完……感觉课程的内容对于没操作过python 的纯小白会有很大难度,我属于半生半熟的勉强能跟上代码操作。后面希望能继续加油。
6.5课程
内容:MMPretrain包
张老师
MMPretrain是一个深度学习预训练算法框架
深度学习模型训练的几个方面:
模型结构,数据,训练优化,运行时,辅助功能
自监督学习的类型
基于代理任务,基于对比学习(simCLR),基于掩码学习(MAE)
多模态算法……
思考:因为今天在赶上次的作业,所以课程没有看完,涉及算法的地方也不太能懂,需要进一步查资料。这节课的笔记只总结了一些关键词后面会补上。。之前是因为种种原因环境配置出问题,所以作业1一直没做好,今天刚能做起来。之后会一步步赶上的。
笔记5
MMPretrain代码课
修改config 配置文件,在个人数据集上训练出结果。【完成作业2】
1 找到config 文件 例如:resnet18_8xb32_in1k.py
修改dataset models schedules....( 对应路径:mmpretrain/configs/_base_/ 文件夹下)
思路:先把数据集分割为训练集和测试集,运行修改后的mmpretrain config文件进行训练(100epoch)和测试,输出结果。(将epoch缩小到10的结果变化?)最后自己找数据出结果。
笔记6
理论课:目标检测与MMDetection
这节课程以目标检测的基本范式为起点,介绍目标检测算法的基础步骤。
bbox:边界框
iou:交并比
receptive field:感受野
Effective RF:有效感受野
nms:非极大值抑制
confidence score:置信度
其中目标检测与图像分类主要有以下几点差别:
1.图片中有多个物体需要识别,2.目标检测中物体的类别和位置信息都需要识别,3.物体的大小不是固定的。
因为对象检测的本质,它可应用于诸多场景,例如:人脸识别,智慧城市,无人驾驶, ocr等等。
笔记7
MMDetection代码课
这节课程通过一系列代码展示,对使用MMDetection加载和预处理数据集进行了演示,并展现了训练和评估目标检测模型的方法。
介绍了MMDetection的安装和配置、设置Python环境、安装依赖包以及配置MMDetection运行环境、介绍MMDetection的模型库,以及了解不同的预训练模型和配置文件。
笔记8
理论课:语音分割与MMSegmentation
本质是对像素分类,给图像中的每个像素分配一个类别,得到特定类别的 mask
应用: 自动驾驶、人像、医疗等
语义分割模型思路
- 全卷积网络
- 空洞卷积与DeepLab模型
- 上下文信息与PSPNet模型
前沿算法:
- Segformer
- K-net
- maskformer
- segment anything
- 等
笔记9
代码课:MMSegmentation代码课
做作业时补充
作业4
流程参考了:14班每日分享——6月15日(作业4攻略&向优秀作业学习)-CSDN社区
下载的文件放在哪个位置参考了:OpenMMLabCamp/homework-4/README.md at main · zeyuanyin/OpenMMLabCamp · GitHub
标download的4个是下载的文件
AI实训营笔记【6.11更新至笔记7】相关推荐
- 国际顶级学界和工业界大咖云集、AIoT 实训营,你不可错过的嵌入式 AI 盛会!...
随着物联网和人工智能技术的飞速发展与相互渗透,万物智联的新赛道已经开始显现.据中商产业研究院<2016-2021年中国物联网产业市场研究报告>显示,预计到2020年,中国物联网的整体规模将 ...
- 郑重告之:智能合约开发实训营第4期学员招募正式启动!
各位同学,抱歉久等了- 这是终于到来的<以太坊智能合约全栈开发>实战特训营第四期的正式招募通知. <以太坊智能合约全栈开发>实战特训营是由硅谷密探和 celer network ...
- 亚马逊首席科学家李沐「实训营」国内独家直播,马上报名 !
开学了,别人家的学校都开始人工智能专业的学习之旅了,你呢? 近年来,国内外顶尖科技企业的 AI 人才抢夺战愈演愈烈.华为开出200万年薪吸引 AI 人才,今年又有 35 所高校新增人工智能本科专业,众 ...
- python量化投资实训班_Python量化投资实训营
配合大鱼金融联手塑造 清华导师领衔授课,全程在清华校园上课 五天掌握Python量化投资必备技能 Python量化投资实训营 五大课程亮点 1. 结构化课程与实战教学 要深入学习量化投资,不仅需要学习 ...
- 人工智能AI实训平台
人工智能AI实训平台 目录 产品外观 产品架构 产品特点 技术优势 产品功能 系统组成 操作使用说明 网络结构 教学实训 手写数字识别项目案例WZ-AISZ-V1.0 人脸识别项目案例WZ-AIRL- ...
- python实训收获_Python量化投资实训营
原标题:Python量化投资实训营 时间:基础班:2018.2.2~2018.2.7(五天) 地点:清华大学深圳研究生院量化研究中心 在2017年,已经成功举办3期线下营队 公益支持方为 清华大学深圳 ...
- 停课不停学 阿里云天池免费开放AI实训平台
疫情肆虐,牵动着每个人的心.当下,正值抗击疫情的关键时刻,近日教育部也下发了2020年春季学期延期开学的通知,并提出利用网络平台保障防控疫情期间学生"停课不停学",全国诸多高校也纷 ...
- 程序员团队名称和口号_济南市大学生双创孵化平台创业菁英实训营2019年第五期【最具人气创业团队】由你来选!...
2019年9月14日,济南市大学生双创孵化平台创业菁英实训营2019年第五期在山东大学(中心校区)就业创业指导中心第一报告厅开营,本次实训营共为期6天,学员们都是来自山东大学.山东财经大学.济南大学. ...
- 【AI特训营】:柯西分布 Paddle API实现
★★★ 本文源自AlStudio社区精品项目,[点击此处]查看更多精品内容 >>> 柯西(Cauchy)分布算子开发 本次开发是由飞桨黑客马拉松中的题目进行进一步详细的分析 任务解析 ...
最新文章
- 纯C#代码的Excel读取器(不需要Office Excel Com组件)
- 波卡链Substrate (6)SubstrateUI界面
- Android Binder Driver缺陷导致定屏问题分析
- 服务器安装mysql文档_Linux 服务器安装MySQL数据库
- Qt5学习笔记之QQ登录界面五:切换界面
- Android:制作Update.zip升级包 【转】
- 在线UML绘图完全免费!
- 【深入浅出flink】第7篇:从原理剖析flink中所有的重分区方式keyBy、broadcast、rebalance、rescale、shuffle、global、partitionCustom
- Pr 音频效果参考:延迟与回声
- .net web 开发平台- 表单设计器 一(web版)
- Oracle数据库 1653错误
- Apple有史以来屏幕最大的手机iPhone 12最新超详细揭秘
- android 闪光灯 频闪,技术丨频闪人像的闪光灯调节和拍摄要点
- 利用 perf4j 做服务监控
- Android Bitmap关于setPixel设置的值和getPixel获得的值不一样的问题
- 佐治亚理工计算机科学,佐治亚理工学院计算机科学面试经验汇总
- Button 点击没有反应
- 帆船运动-第13届蓝桥杯Scratch省赛真题第2题
- 科技型中小企业认定条件和好处
- Kali下压缩解压缩命令大全zip、gz、tar、tar.gz、bz2、tar.bz2、bz、tar.bz、Z、tar.Z、taz、tar.tgz、zip、rar、lha