• 5.31开营

    • 需要交至少3次作业(共5次)
    • 算法库

      • MMOCR 文字检测库

        • 提取结构化信息
      • MMDetection3D
      • MMRotate 旋转目标检测
      • 图像分割算法库

        • 图像分割是识别提取的
      • 图像分类+预训练+多模态 MMPretrain

        • 图像分类(Image Classification )图像描述(lmage Caption )视觉问答( Visual Question Answering )
        • 视觉定位(Visual Grounding )检索(Retrievallmage-To-lmageText-To-lmagelmage-To-Text)
      • 姿态
  • 感觉做CV会涉及到各行各业 生物 交通 农业 机械....

6.1课程

人体姿态估计 MMPose包

讲师:卢策吾老师

中文文档:欢迎来到 MMPose 中文文档! — MMPose 1.0.0 文档

(课后要自己看一看中文文档)

2d姿态估计:

自顶向下:先确定人体

基于回归:对关键点的位置进行概率建模

基于热力图的建模

自底向上:先找关键点 再聚类

找关节

多人姿态估计

3d姿态估计:

人体参数表面化,将人体表面划分为24块...

思考:涉及算法的地方不是特别懂,但是一定要多思考搞清思路和用途,再找到对应的包的操作方法和代码,会用再说

6.2课程

子豪(b站有号):MMPose 代码教程

https://www.bilibili.com/video/BV1Pa4y1g7N7

​​​​​​https://www.bilibili.com/video/BV1Lm4y1879K

https://www.bilibili.com/video/BV12a4y1u7sd

先进行环境配置+安装

(学员手册里有个demo:

  • 学员手册-环境配置 6.4已经看完并操作完

    • conda activate openmmlab

      激活虚拟环境

进度:目前操作了MMPose 和MMdetection 包安装,没有太大问题。后两个检测三角板的实践的视频还没来得及看,希望明天能赶紧补上做好作业……

思考:没有太多思考因为内容没看完……感觉课程的内容对于没操作过python 的纯小白会有很大难度,我属于半生半熟的勉强能跟上代码操作。后面希望能继续加油。

6.5课程

内容:MMPretrain包

张老师

MMPretrain是一个深度学习预训练算法框架

深度学习模型训练的几个方面:

模型结构,数据,训练优化,运行时,辅助功能

自监督学习的类型

基于代理任务,基于对比学习(simCLR),基于掩码学习(MAE)

多模态算法……

思考:因为今天在赶上次的作业,所以课程没有看完,涉及算法的地方也不太能懂,需要进一步查资料。这节课的笔记只总结了一些关键词后面会补上。。之前是因为种种原因环境配置出问题,所以作业1一直没做好,今天刚能做起来。之后会一步步赶上的。

笔记5 

MMPretrain代码课

修改config 配置文件,在个人数据集上训练出结果。【完成作业2】

1 找到config 文件 例如:resnet18_8xb32_in1k.py

修改dataset models schedules....( 对应路径:mmpretrain/configs/_base_/  文件夹下)

思路:先把数据集分割为训练集和测试集,运行修改后的mmpretrain config文件进行训练(100epoch)和测试,输出结果。(将epoch缩小到10的结果变化?)最后自己找数据出结果。

笔记6

理论课:目标检测与MMDetection

这节课程以目标检测的基本范式为起点,介绍目标检测算法的基础步骤。

bbox:边界框

iou:交并比

receptive field:感受野

Effective RF:有效感受野

nms:非极大值抑制

confidence score:置信度

其中目标检测与图像分类主要有以下几点差别:

1.图片中有多个物体需要识别,2.目标检测中物体的类别和位置信息都需要识别,3.物体的大小不是固定的。

因为对象检测的本质,它可应用于诸多场景,例如:人脸识别,智慧城市,无人驾驶, ocr等等。

笔记7

MMDetection代码课

这节课程通过一系列代码展示,对使用MMDetection加载和预处理数据集进行了演示,并展现了训练和评估目标检测模型的方法。

介绍了MMDetection的安装和配置、设置Python环境、安装依赖包以及配置MMDetection运行环境、介绍MMDetection的模型库,以及了解不同的预训练模型和配置文件。

笔记8

理论课:语音分割与MMSegmentation

本质是对像素分类,给图像中的每个像素分配一个类别,得到特定类别的 mask

应用: 自动驾驶、人像、医疗等

语义分割模型思路

  • 全卷积网络
  • 空洞卷积与DeepLab模型
  • 上下文信息与PSPNet模型

前沿算法:

  • Segformer
  • K-net
  • maskformer
  • segment anything

笔记9

代码课:MMSegmentation代码课

做作业时补充

作业4

流程参考了:14班每日分享——6月15日(作业4攻略&向优秀作业学习)-CSDN社区

下载的文件放在哪个位置参考了:OpenMMLabCamp/homework-4/README.md at main · zeyuanyin/OpenMMLabCamp · GitHub

标download的4个是下载的文件

AI实训营笔记【6.11更新至笔记7】相关推荐

  1. 国际顶级学界和工业界大咖云集、AIoT 实训营,你不可错过的嵌入式 AI 盛会!...

    随着物联网和人工智能技术的飞速发展与相互渗透,万物智联的新赛道已经开始显现.据中商产业研究院<2016-2021年中国物联网产业市场研究报告>显示,预计到2020年,中国物联网的整体规模将 ...

  2. 郑重告之:智能合约开发实训营第4期学员招募正式启动!

    各位同学,抱歉久等了- 这是终于到来的<以太坊智能合约全栈开发>实战特训营第四期的正式招募通知. <以太坊智能合约全栈开发>实战特训营是由硅谷密探和 celer network ...

  3. 亚马逊首席科学家李沐「实训营」国内独家直播,马上报名 !

    开学了,别人家的学校都开始人工智能专业的学习之旅了,你呢? 近年来,国内外顶尖科技企业的 AI 人才抢夺战愈演愈烈.华为开出200万年薪吸引 AI 人才,今年又有 35 所高校新增人工智能本科专业,众 ...

  4. python量化投资实训班_Python量化投资实训营

    配合大鱼金融联手塑造 清华导师领衔授课,全程在清华校园上课 五天掌握Python量化投资必备技能 Python量化投资实训营 五大课程亮点 1. 结构化课程与实战教学 要深入学习量化投资,不仅需要学习 ...

  5. 人工智能AI实训平台

    人工智能AI实训平台 目录 产品外观 产品架构 产品特点 技术优势 产品功能 系统组成 操作使用说明 网络结构 教学实训 手写数字识别项目案例WZ-AISZ-V1.0 人脸识别项目案例WZ-AIRL- ...

  6. python实训收获_Python量化投资实训营

    原标题:Python量化投资实训营 时间:基础班:2018.2.2~2018.2.7(五天) 地点:清华大学深圳研究生院量化研究中心 在2017年,已经成功举办3期线下营队 公益支持方为 清华大学深圳 ...

  7. 停课不停学 阿里云天池免费开放AI实训平台

    疫情肆虐,牵动着每个人的心.当下,正值抗击疫情的关键时刻,近日教育部也下发了2020年春季学期延期开学的通知,并提出利用网络平台保障防控疫情期间学生"停课不停学",全国诸多高校也纷 ...

  8. 程序员团队名称和口号_济南市大学生双创孵化平台创业菁英实训营2019年第五期【最具人气创业团队】由你来选!...

    2019年9月14日,济南市大学生双创孵化平台创业菁英实训营2019年第五期在山东大学(中心校区)就业创业指导中心第一报告厅开营,本次实训营共为期6天,学员们都是来自山东大学.山东财经大学.济南大学. ...

  9. 【AI特训营】:柯西分布 Paddle API实现

    ★★★ 本文源自AlStudio社区精品项目,[点击此处]查看更多精品内容 >>> 柯西(Cauchy)分布算子开发 本次开发是由飞桨黑客马拉松中的题目进行进一步详细的分析 任务解析 ...

最新文章

  1. 纯C#代码的Excel读取器(不需要Office Excel Com组件)
  2. 波卡链Substrate (6)SubstrateUI界面
  3. Android Binder Driver缺陷导致定屏问题分析
  4. 服务器安装mysql文档_Linux 服务器安装MySQL数据库
  5. Qt5学习笔记之QQ登录界面五:切换界面
  6. Android:制作Update.zip升级包 【转】
  7. 在线UML绘图完全免费!
  8. 【深入浅出flink】第7篇:从原理剖析flink中所有的重分区方式keyBy、broadcast、rebalance、rescale、shuffle、global、partitionCustom
  9. Pr 音频效果参考:延迟与回声
  10. .net web 开发平台- 表单设计器 一(web版)
  11. Oracle数据库 1653错误
  12. Apple有史以来屏幕最大的手机iPhone 12最新超详细揭秘
  13. android 闪光灯 频闪,技术丨频闪人像的闪光灯调节和拍摄要点
  14. 利用 perf4j 做服务监控
  15. Android Bitmap关于setPixel设置的值和getPixel获得的值不一样的问题
  16. 佐治亚理工计算机科学,佐治亚理工学院计算机科学面试经验汇总
  17. Button 点击没有反应
  18. 帆船运动-第13届蓝桥杯Scratch省赛真题第2题
  19. 科技型中小企业认定条件和好处
  20. Kali下压缩解压缩命令大全zip、gz、tar、tar.gz、bz2、tar.bz2、bz、tar.bz、Z、tar.Z、taz、tar.tgz、zip、rar、lha

热门文章

  1. ipcs ipcrm
  2. Word2Vec 使用总结
  3. WampServer修改Mysql密码的步骤
  4. 哪个电容笔是主动式?好用不贵电容笔测评
  5. 科普,什么是“NP难”的问题。专业的解释俺看不懂。这个文章里面举了几个例子,俺一下就明白了。
  6. 闭关一个月,吃透三百页pdf,终于拿下腾讯Android工程师offer!
  7. 【NOJ1142】【算法实验二】踩气球
  8. ⭐⭐2021诺贝尔生理学或医学奖揭晓⭐⭐
  9. OSPF系列小实验之7:断裂的区域连接
  10. OPENSTACK 网络相关概念