原文链接:http://www.shellsec.com/tech/194176.html

目录

  • 简介
  • 要点记录
  • 提问
  • 总结

简介

报告时间是北京时间 14年12月14日 凌晨一点到两点,主讲人是 Caffe 团队的核心之一 Evan Shelhamer。第一次用 GoToMeeting 参加视频会议,效果真是不错。

报告后分享出了 视频 和 展示文件 (链接在收到邮件后会补上)。

Caffe 此前听过没用过,所以报告前自己试运行了一下,参照 官方教程 。Caffe 安装、上手都很快,Protobuf 式的层定义很直观,模型修改或算法调整变得很容易,相当于只需要改配置文件。还找到了他们放在 Google Docs 上一个教程 PPT, DIY Deep Learning for Vision: a Hands-On Tutorial with Caffe (已搬到墙里),后来发现这次报告的 PPT 就是在这个基础上修改的。

本次报告主要内容是

  • 对机器学习、深度学习的一些介绍,包括若干深度学习的经典模型;
  • Caffe 的 优势 (模块化、速度、社区支持等)、
  • 基本结构 (网络定义、层定义、Blob等)和
  • 用法 (模型中损失函数、优化方法、共享权重等的配置、应用举例、参数调优的技巧),
  • 以及 未来方向 (CPU/GPU 并行化、Pythonification、Fully Convolutional Networks等)。

以下是报告中的截图配上自己的一点笔记,一手资料请参见上面给出的会后分享链接。

要点记录

PPT 的首页取自该项目的一个在线 demo ,输入图片 url,识别物体类别。

一个示例, 看一下效果:

左边是浅层特征,各类别物体杂乱无章;右边是深度特征,一些类别有较为明显的分别。

特别地, dog、bird、invertebrate 这三类动物类别离得较近,而 building、vehicle、commodity 这类无生命类别离得较近,可见深度特征的强大。

此外,在深层结构当中, 隐层神经元的激活可能与特定的物体类别有关

比如有的神经元对人像敏感,而有的对数字或建筑物敏感,最下面一层是闪光灯(或与之类似,比如反光的脑门……)效果。

Caffe 的优势,网络结构的模块化和易表达是显然的,社区资源也同样强大,比如下两页内容。

Caffe 的 Reference Models 可供学术使用,比如 AlexNet、R-CNN、CaffeNet,包括模型定义、优化方法和预训练权重。

Model Zoo 中有用户贡献的模型可供参考使用,比如 VGG、Network-in-Network。

Caffe 支持丰富的模型表达形式,包括 DAGs、Weight Sharing 以及 Siamese Network。

网络和层定义采用 protobuf 的样式。

Layer 指的是权重和偏置,可以定义连接数、权重初始化方法等。

Blob 是四维数据结构,保存节点上的数值以及模型参数,可以通过编程在 CPU 和 GPU 间传输。

模型定义之外,还需要一个指定优化策略的配置文件,用以训练模型。

使用 Caffe 训练的一般步骤就是

  • 数据预处理;
  • 模型定义;
  • 求解策略定义;
  • 运行。

此处给出了两个例子, Logistic Regression , Learn LeNet on MNIST ,都很好 follow。

调参中重点讲了一个模型迁移 的实例,用某项任务已有模型的参数作为新任务模型的参数初始值,然后进行模型训练。

模型训练一般由浅入深,逐步降低学习速率,以保持预训练参数的某些性质。

接下来具体讲述了 Loss、Solver、DAG、Weight Sharing 的概念和配置。

对同一模型,不同 Solver 的表现有差。

一般深度学习模型是线性形式的,比如 LeNet,而 Caffe 支持DAG 形式的模型。

Caffe 的近期动向,CPU/GPU 并行化、Pythonification、Fully Convolutional Networks等。

使用CUDA进行并行化加速........

Caffe 的团队,拜 Yangqing Jia 师兄……

文献参考。

提问

语音回答中,Evan 提到 UCB 的一个团队正在开发 Scala 接口,不过尚属实验性质;

Caffe 团队在考虑 和 UCB 的 AMP 团队合作,扩展到 Spark 这一计算平台上;

除了已支持的 CPU/GPU 计算,也考虑扩展支持 OpenCl;

对于 Theano、Torch,鼓励大家尝试、比较……

文字问答如下,由 Yangqing Jia 回复。

Q: Is the pre-trained model avaialbe for download to accelerate our work on other kinds of images?

A:FYI – for pretrained models that we release, please refer to the model zoo page here:http://caffe.berkeleyvision.org/model_zoo.html

Q: Android platform ?

A:People have asked about android/ios platforms. In principle this is possible since the code is purely in C, but of course some engineering efforts are needed to write makefiles like Android.mk for this. Our bandwidth is limited and we are focusing on the research part, but we welcome pull requests on github if you write one (and we thank you in advance)! Also, kindly check out the blog post by my colleague Pete Warden about our efforts on running with Jetson TK1:http://petewarden.com/2014/10/25/how-to-run-the-caffe-deep-learning-vision-library-on-nvidias-jetson-mobile-gpu-board/

Q: Can you discuss status and/or considerations for adding opencl support (and so be vendor neutral, as opposed to NVIDIA CUDA)?

A:In terms of using OpenCL – it has been under discussion for a while, but we are kind of shortstaffed so we focus more on the research side – we welcome contributions from open-source communities of course, please join us at github

Q: do you have an online examples of unsupervised losses

A:For unsupevised losses and training there is a bundled example of an MNIST autoencoder.

总结

“盗取”一页 PPT 作为本文总结。

DL for Vision:A Tutorial with Caffe 报告笔记相关推荐

  1. On Tutorial with Caffe--a Hands DIY DL for Vision

    原文链接:http://blog.sciencenet.cn/blog-1583812-844177.html Caffe作为DL的一个学习框架,Caffe is a deep learning fr ...

  2. caffe学习笔记(2)

    caffe学习笔记(2)-视觉层(vision layers) 本文参考博客caffe学习,是根据这篇博客做的学习笔记.详细情况可以参考原博客,真的很赞. 所有的层都具有的参数,如name, type ...

  3. caffe学习笔记2:net forward与backward

    caffe学习笔记2:Forward and Backward 原网页:http://caffe.berkeleyvision.org/tutorial/forward_backward.html f ...

  4. caffe读书笔记1 CIFAR-10在caffe上进行训练与学习

    原文地址:caffe读书笔记1 CIFAR-10在caffe上进行训练与学习-薛开宇作者:残夕云翳 本次学习笔记作用,知道如何在caffe上训练与学习,如何看结果. 1.1使用数据库:CIFAR-10 ...

  5. CAFFE学习笔记(一)Caffe_Example之训练mnist

     CAFFE学习笔记(一)Caffe_Example之训练mnist 0.参考文献 [1]caffe官网<Training LeNet on MNIST with Caffe>;  [ ...

  6. Caffe学习笔记4图像特征进行可视化

    Caffe学习笔记4图像特征进行可视化 本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权 欢迎关注我的博客:http://blog.csdn.net/hit201 ...

  7. Caffe学习笔记3——制作并训练自己的数据集

    Caffe学习笔记3 本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权 欢迎关注我的博客:http://blog.csdn.net/hit2015spring和h ...

  8. Caffe学习笔记2

    Caffe学习笔记2-用一个预训练模型提取特征 本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权 欢迎关注我的博客:http://blog.csdn.net/hi ...

  9. Caffe 学习笔记1

    Caffe 学习笔记1 本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权 欢迎关注我的博客:http://blog.csdn.net/hit2015spring和 ...

最新文章

  1. HBase底层存储原理——我靠,和cassandra本质上没有区别啊!都是kv 列存储,只是一个是p2p另一个是集中式而已!...
  2. 配置apache+php环境详解
  3. C#中使用Path、Directory、Split、Substring实现对文件路径和文件名的常用操作实例
  4. java对象的访问定位_JVM创建对象及访问定位过程详解
  5. java class文件常量池_《Java虚拟机原理图解》 1.2.3、Class文件中的常量池详解(下)...
  6. 查看centos硬件配置
  7. eclipse 改包名
  8. java 并行框架_JAVA并行框架学习之ForkJoin
  9. 奇数值结点链表(C语言实现)
  10. 分切机设备的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  11. windows10系统修改c盘user文件夹下的计算机名称
  12. 神经网络(4)---神经网络是如何帮助我们学习复杂的nonlinear hypotheses
  13. [cv]郑哲东 Deep-ReID——Learn pedestrian representations from
  14. Python 阴阳师/pillow-窗口截屏/opencv-图像识别/pyaotugui-点击/pyqt5-UI界面设计/pyqt5-窗口绘制
  15. 转自科学网:《评论:“副教授,我缺少的是什么?”》
  16. 自动化部署工具瓦力(walle)的简单项目配置步骤
  17. Ceph _backfill and recovery 之间的不同以及 peering理解
  18. CANoe.DiVa操作指南-运行环境搭建
  19. TypeScript 实用工具类型之 Pick 类型
  20. 【Python】漏斗模型--生成漏斗案例 Demo实例

热门文章

  1. Msc系统上的eclipse遇到乱码问题解决方式
  2. Eclipse字符集设置方式
  3. [Z]建國中學 2012 年資訊科培訓網站
  4. 如何在mapinfo中查看link ID
  5. String和string的区别
  6. error while loading shared libraries: libatomic.so.1
  7. Go语言 中文分词技术使用技巧(一)
  8. 使用typedef简化函数指针的声明
  9. WPF中引入外部资源
  10. 弹出taskeng.exe窗口的解决方法