先用caffe对cifar10进行训练,将训练的结果模型进行保存,得到一个caffemodel,然后从测试图片中选出一张进行测试,并进行可视化。

In [1]:
#加载必要的库
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import sys,os,caffe

In [2]:
#设置当前目录,判断模型是否训练好
caffe_root = '/home/bnu/caffe/'
sys.path.insert(0, caffe_root + 'python')
os.chdir(caffe_root)
if not os.path.isfile(caffe_root + 'examples/cifar10/cifar10_quick_iter_4000.caffemodel'):print("caffemodel is not exist...")

In [3]:
#利用提前训练好的模型,设置测试网络
caffe.set_mode_gpu()
net = caffe.Net(caffe_root + 'examples/cifar10/cifar10_quick.prototxt',caffe_root + 'examples/cifar10/cifar10_quick_iter_4000.caffemodel',caffe.TEST)

In [4]:
net.blobs['data'].data.shape

Out[4]:
(1, 3, 32, 32)

In [5]:
#加载测试图片,并显示
im = caffe.io.load_image('examples/images/32.jpg')
print im.shape
plt.imshow(im)
plt.axis('off')

(32, 32, 3)

Out[5]:
(-0.5, 31.5, 31.5, -0.5)

In [6]:
# 编写一个函数,将二进制的均值转换为python的均值
def convert_mean(binMean,npyMean):blob = caffe.proto.caffe_pb2.BlobProto()bin_mean = open(binMean, 'rb' ).read()blob.ParseFromString(bin_mean)arr = np.array( caffe.io.blobproto_to_array(blob) )npy_mean = arr[0]np.save(npyMean, npy_mean )
binMean=caffe_root+'examples/cifar10/mean.binaryproto'
npyMean=caffe_root+'examples/cifar10/mean.npy'
convert_mean(binMean,npyMean)

In [7]:
#将图片载入blob中,并减去均值
transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})
transformer.set_transpose('data', (2,0,1))
transformer.set_mean('data', np.load(npyMean).mean(1).mean(1)) # 减去均值
transformer.set_raw_scale('data', 255)
transformer.set_channel_swap('data', (2,1,0))
net.blobs['data'].data[...] = transformer.preprocess('data',im)
inputData=net.blobs['data'].data

In [8]:
#显示减去均值前后的数据
plt.figure()
plt.subplot(1,2,1),plt.title("origin")
plt.imshow(im)
plt.axis('off')
plt.subplot(1,2,2),plt.title("subtract mean")
plt.imshow(transformer.deprocess('data', inputData[0]))
plt.axis('off')

Out[8]:
(-0.5, 31.5, 31.5, -0.5)

In [9]:
#运行测试模型,并显示各层数据信息
net.forward()
[(k, v.data.shape) for k, v in net.blobs.items()]

Out[9]:
[('data', (1, 3, 32, 32)),('conv1', (1, 32, 32, 32)),('pool1', (1, 32, 16, 16)),('conv2', (1, 32, 16, 16)),('pool2', (1, 32, 8, 8)),('conv3', (1, 64, 8, 8)),('pool3', (1, 64, 4, 4)),('ip1', (1, 64)),('ip2', (1, 10)),('prob', (1, 10))]

In [10]:
#显示各层的参数信息
[(k, v[0].data.shape) for k, v in net.params.items()]

Out[10]:
[('conv1', (32, 3, 5, 5)),('conv2', (32, 32, 5, 5)),('conv3', (64, 32, 5, 5)),('ip1', (64, 1024)),('ip2', (10, 64))]

In [11]:
# 编写一个函数,用于显示各层数据
def show_data(data, padsize=1, padval=0):data -= data.min()data /= data.max()# force the number of filters to be squaren = int(np.ceil(np.sqrt(data.shape[0])))padding = ((0, n ** 2 - data.shape[0]), (0, padsize), (0, padsize)) + ((0, 0),) * (data.ndim - 3)data = np.pad(data, padding, mode='constant', constant_values=(padval, padval))# tile the filters into an imagedata = data.reshape((n, n) + data.shape[1:]).transpose((0, 2, 1, 3) + tuple(range(4, data.ndim + 1)))data = data.reshape((n * data.shape[1], n * data.shape[3]) + data.shape[4:])plt.figure()plt.imshow(data,cmap='gray')plt.axis('off')
plt.rcParams['figure.figsize'] = (8, 8)
plt.rcParams['image.interpolation'] = 'nearest'
plt.rcParams['image.cmap'] = 'gray'

In [12]:
#显示第一个卷积层的输出数据和权值(filter)
show_data(net.blobs['conv1'].data[0])
print net.blobs['conv1'].data.shape
show_data(net.params['conv1'][0].data.reshape(32*3,5,5))
print net.params['conv1'][0].data.shape

(1, 32, 32, 32)
(32, 3, 5, 5)

In [13]:
#显示第一次pooling后的输出数据
show_data(net.blobs['pool1'].data[0])
net.blobs['pool1'].data.shape

Out[13]:
(1, 32, 16, 16)

In [14]:
#显示第二次卷积后的输出数据以及相应的权值(filter)
show_data(net.blobs['conv2'].data[0],padval=0.5)
print net.blobs['conv2'].data.shape
show_data(net.params['conv2'][0].data.reshape(32**2,5,5))
print net.params['conv2'][0].data.shape

(1, 32, 16, 16)
(32, 32, 5, 5)

In [15]:
#显示第三次卷积后的输出数据以及相应的权值(filter),取前1024个进行显示
show_data(net.blobs['conv3'].data[0],padval=0.5)
print net.blobs['conv3'].data.shape
show_data(net.params['conv3'][0].data.reshape(64*32,5,5)[:1024])
print net.params['conv3'][0].data.shape

(1, 64, 8, 8)
(64, 32, 5, 5)

In [16]:
#显示第三次池化后的输出数据
show_data(net.blobs['pool3'].data[0],padval=0.2)
print net.blobs['pool3'].data.shape

(1, 64, 4, 4)

In [17]:
# 最后一层输入属于某个类的概率
feat = net.blobs['prob'].data[0]
print feat
plt.plot(feat.flat)

[  5.21440245e-03   1.58397834e-05   3.71246301e-02   2.28459597e-011.08315737e-03   7.17785358e-01   1.91939052e-03   7.67927198e-036.13298907e-04   1.05107691e-04]

Out[17]:
[<matplotlib.lines.Line2D at 0x7f3d882b00d0>]

从输入的结果和图示来看,最大的概率是7.17785358e-01,属于第5类(标号从0开始)。与cifar10中的10种类型名称进行对比:

airplane、automobile、bird、cat、deer、dog、frog、horse、ship、truck

根据测试结果,判断为dog。 测试无误!

Caffe学习系列(17):模型各层数据和参数可视化相关推荐

  1. Caffe学习系列(17):模型各层特征和过滤器可视化

    转载自: Caffe学习系列(17):模型各层特征和过滤器可视化 - denny402 - 博客园 http://www.cnblogs.com/denny402/p/5105911.html cif ...

  2. Caffe学习系列(16):各层权值参数可视化

    原文有更新: Caffe学习系列(16):各层权值参数可视化 - denny402 - 博客园 http://www.cnblogs.com/denny402/p/5103425.html 通过前面的 ...

  3. Caffe学习系列(5):其它常用层及参数

    本文讲解一些其它的常用层,包括:softmax_loss层,Inner Product层,accuracy层,reshape层和dropout层及其它们的参数配置. 1.softmax-loss so ...

  4. Caffe 学习系列

    学习列表: Google protocol buffer在windows下的编译 caffe windows 学习第一步:编译和安装(vs2012+win 64) caffe windows学习:第一 ...

  5. Caffe学习系列(22):caffe图形化操作工具digits运行实例

    上接:Caffe学习系列(21):caffe图形化操作工具digits的安装与运行 经过前面的操作,我们就把数据准备好了. 一.训练一个model 右击右边Models模块的" Images ...

  6. Caffe学习系列(18): 绘制网络模型

    转载自: Caffe学习系列(18): 绘制网络模型 - denny402 - 博客园 http://www.cnblogs.com/denny402/p/5106764.html python/dr ...

  7. Caffe学习系列(12):训练和测试自己的图片

    学习caffe的目的,不是简单的做几个练习,最终还是要用到自己的实际项目或科研中.因此,本文介绍一下,从自己的原始图片到lmdb数据,再到训练和测试模型的整个流程. 一.准备数据 有条件的同学,可以去 ...

  8. 【12】Caffe学习系列:训练和测试自己的图片

    一.准备数据 有条件的同学,可以去imagenet的官网http://www.image-net.org/download-images,下载imagenet图片来训练.验证码始终出不来需要翻墙(是g ...

  9. Caffe学习系列(十):腾讯ncnn框架

    Caffe学习系列(十):腾讯ncnn框架 <手把手AI项目>七.MobileNetSSD通过Ncnn前向推理框架在PC端的使用(目标检测 objection detection) 1.n ...

最新文章

  1. OpenStack 虚拟机的配置初始化 — Cloud-Init Config Drive | Metadata API
  2. Java 18 正式发布
  3. Grad-CAM (CNN可视化) Python示例
  4. 网络招聘“草莽时代”该结束了
  5. QDoc包括外部代码includingexternalcode
  6. mysql 视图怎么调用方法_mysql 视图的使用
  7. 最小生成树之prim算法
  8. 《SAS编程与数据挖掘商业案例》学习笔记之十
  9. java json 解析null_解析包含null的原始json数组
  10. stringwriter_Java StringWriter toString()方法与示例
  11. 前端学习(2695):重读vue电商网站16之Upload 上传组件
  12. jq获取id的名称_查找 Linux 发行版名称、版本和内核详细信息 | Linux 中国
  13. 敏捷项目管理流程-Scrum框架最全总结
  14. 高阶无模型自适应迭代学习控制学习记录
  15. R语言爬虫系列6|动态数据抓取范例
  16. java csv 换行_javacsv如何换行输入
  17. 界面原型创建工具Axure使用教程
  18. 【详细】endnote中英文文献混排
  19. 【说明书】迪士尼儿童手表说明书
  20. iOS 高德地图(二)(进阶具体使用的细节)

热门文章

  1. 使用 BOOST_PROTO_DEFINE_OPERATORS 使用非原型类型 std::vector<> 对表达式进行原型化的示例
  2. boost::multiprecision模块logged_adaptor相关的测试程序
  3. boost::hana::infix用法的测试程序
  4. boost::fusion::detail::and_用法的测试
  5. DCMTK:测试图像像素模块功能
  6. OpenCV图像入门
  7. Qt Creator使用其他构建系统
  8. C语言链表返回第n个到最后的节点的算法(附完整源码)
  9. OpenGL Viewport Array视口阵列的实例
  10. OpenGL raytracer光线追踪的实例