python风格变换图片_图片风格转换--深度学习介绍

前言

先举个机器学习的应用例子：图片的风格转换。

原图.jpg

处理后的图.jpg

机器学习

通过计算机强大的计算能力进行迭代运算、试错得到相关知识。

形象生动的描述请看：机器学习

深度学习

神经网络

上图是一个网络神经示意图，左边的是输入层，最右边的是输出层，两层之间的叫隐藏层，隐藏层大于2的神经网络就叫深度神经网络，深度学习就是基于深度神经网络的机器学习，深度学习是机器学习中的一种。

深度学习的相关概念

1、感知器

2、线性单元和梯度下降

3、神经网络和反向传播算法

4、卷积神经网络

一、感知器

感知器.png

1、输入权值：

x1，x2...是值，w1,w2....是权重。

2、激活函数：

这里举个最简单的例子，采用阶跃函数

阶跃函数.png

输入权值，经过激活函数后就是0或1。

3、输出：

感知器就是通过输入的权重与值，经过激活函数预算，再通过输出公式得出结果

二、线性单元和梯度下降

1、什么是线性单元

激活函数为线性函数的感知器就叫做线性单元。

当面对的数据集不是线性可分的时候，『感知器规则』可能无法收敛，所以我们用可导的线性函数来替代感知器的激活函数，例如f(x) = x

之后，线性单元将返回一个实数值而不是0,1分类。因此线性单元用来解决回归问题。

2、监督学习和无监督学习

机器学习有一类学习方法叫做监督学习，它是说为了训练一个模型，我们要提供这样一堆训练样本：每个训练样本即包括输入特征x，也包括对应的输出y(y也叫做标记，label)。也就是说，我们要找到很多人，我们既知道他们的特征x(工作年限，行业...)，也知道他们的收入y。我们用这样的样本去训练模型，让模型既看到我们提出的每个问题(输入特征x)，也看到对应问题的答案(标记y)。当模型看到足够多的样本之后，它就能总结出其中的一些规律。然后，就可以预测那些它没看过的输入所对应的答案了。

另外一类学习方法叫做无监督学习，这种方法的训练样本中只有x而没有y。模型可以总结出特征x的一些规律，但是无法知道其对应的答案y。

3、线性单元的目标函数

所有误差之和.png

Paste_Image.png

误差

模型的训练，实际上就是求取到合适的w，使误差E取得最小值。这在数学上称作优化问题，而就是我们优化的目标，称之为目标函数

4、梯度下降优化算法

梯度是一个向量，它指向函数值上升最快的方向,梯度的反方向当然就是函数值下降最快的方向.沿着梯度相反方向去修改x的值,进行迭代获得最小值。

Paste_Image.png

首先我们选择一个点开始，x0,接下来迭代x1,x2，x3..一直到函数最小值。

梯度下降算法的公式如下：

梯度下降算法公式.png

三、神经网络和反向传播算法

神经元

神经元就是激活函数或tanh函数的感知器。

多个神经元构成神经网络

神经元.png

sigmoid函数.png

神经网络的输出

神经网络实际上就是一个输入向量x(向量,不是普通的变量，具有方向)到输出向量y的函数，即：

Paste_Image.png

神经网络的输出.png

神经网络.png

反向传播算法(Back Propagation)

我们需要知道一个神经网络的每个连接上的权值是如何得到的。我们可以说神经网络是一个模型，那么这些权值就是模型的参数，也就是模型要学习的东西。然而，一个神经网络的连接方式、网络的层数、每层的节点数这些参数，则不是学习出来的，而是人为事先设置的。对于这些人为设置的参数，我们称之为超参数(Hyper-Parameters)。而我们需要做的是通过算法对神经网络进行训练，反向传播算法是神经网络训练算法。

计算一个节点的误差项，需要先计算每个与其相连的下一层节点的误差项。这就要求误差项的计算顺序必须是从输出层开始，然后反向依次计算每个隐藏层的误差项，直到与输入层相连的那个隐藏层。这就是反向传播算法的名字的含义，最后我们可以通过计算出的误差反过来修正权重。

就这样，通过不断迭代，不断修正权重对神经网络进行训练。

神经网络的输出.png

四、卷积神经网络

适合图像、语音识别任务的神经网络结构——卷积神经网络

1、Relu激活函数

在卷积神经网络中Relu函数更为适合作为激活函数，公式如下：

Relu.png

Relu函数图像如下图所示：

采用Relu函数，有以下优点：

速度快

减轻梯度消失问题

稀疏性

2、卷积神经网络

一个卷积神经网络由若干卷积层、Pooling层、全连接层组成

卷积神经网络.png

我们可以发现卷积神经网络的层结构和全连接神经网络的层结构有很大不同。全连接神经网络每层的神经元是按照一维排列的，也就是排成一条线的样子；而卷积神经网络每层的神经元是按照三维排列的，也就是排成一个长方体的样子，有宽度、高度和深度

实践应用：

一、通过深度学习对图片进行风格转换

原图与名画合成新图片：

原图.jpg

bigjiasuo.jpg

14764268560.0-10-bigjiasuo-googlenet-content-1e4-512.jpg

14764182840.0-10-fango-googlenet-content-1e4-512.jpg

主要的流程是：利用Caffe框架进行深度学习，通过梯度算法，完成颜色、线条等的训练集，然后对图片进行重绘。

1、框架、依赖等准备

(1)、安装python、pip、numpy。

(2)、安装深度学习框架googlenet model

(4)、下载style-transfer代码，根据自己的需求进行修改、优化。

(5)、根据style-transfer文档运行。

这几个步骤操作起来都是比较困难的，也算是个不小的门槛。其中Caffe的安装琐碎，会出现很多意外，是个大难题；style-transfer代码修改是最核心的部分。

2、核心代码展示

梯度处理代码：

def _compute_style_grad(F, G, G_style, layer):

(Fl, Gl) = (F[layer], G[layer])

c = Fl.shape[0]**-2 * Fl.shape[1]**-2

El = Gl - G_style[layer]

loss = c/4 * (El**2).sum()

grad = c * sgemm(1.0, El, Fl) * (Fl>0)

return loss, grad

def _compute_content_grad(F, F_content, layer):

Fl = F[layer]

El = Fl - F_content[layer]

loss = (El**2).sum() / 2

grad = El * (Fl>0)

return loss, grad

矩阵计算

def _compute_reprs(net_in, net, layers_style, layers_content, gram_scale=1):

(repr_s, repr_c) = ({}, {})

net.blobs["data"].data[0] = net_in

net.forward()

for layer in set(layers_style)|set(layers_content):

F = net.blobs[layer].data[0].copy()

F.shape = (F.shape[0], -1)

repr_c[layer] = F

if layer in layers_style:

repr_s[layer] = sgemm(gram_scale, F, F.T)

return repr_s, repr_c

进行转换：

def transfer_style(self, img_style, img_content, length=512, ratio=1e5,

n_iter=512, init="-1", verbose=False, callback=None):

# assume that convnet input is square

orig_dim = min(self.net.blobs["data"].shape[2:])

# rescale the images

scale = max(length / float(max(img_style.shape[:2])),

orig_dim / float(min(img_style.shape[:2])))

img_style = rescale(img_style, STYLE_SCALE*scale)

scale = max(length / float(max(img_content.shape[:2])),

orig_dim / float(min(img_content.shape[:2])))

img_content = rescale(img_content, scale)

# compute style representations

self._rescale_net(img_style)

layers = self.weights["style"].keys()

net_in = self.transformer.preprocess("data", img_style)

gram_scale = float(img_content.size)/img_style.size

G_style = _compute_reprs(net_in, self.net, layers, [],

gram_scale=1)[0]

# compute content representations

self._rescale_net(img_content)

layers = self.weights["content"].keys()

net_in = self.transformer.preprocess("data", img_content)

F_content = _compute_reprs(net_in, self.net, [], layers)[1]

# generate initial net input

# "content" = content image, see kaishengtai/neuralart

if isinstance(init, np.ndarray):

img0 = self.transformer.preprocess("data", init)

elif init == "content":

img0 = self.transformer.preprocess("data", img_content)

elif init == "mixed":

img0 = 0.95*self.transformer.preprocess("data", img_content) + \

0.05*self.transformer.preprocess("data", img_style)

else:

img0 = self._make_noise_input(init)

# compute data bounds

data_min = -self.transformer.mean["data"][:,0,0]

data_max = data_min + self.transformer.raw_scale["data"]

data_bounds = [(data_min[0], data_max[0])]*(img0.size/3) + \

[(data_min[1], data_max[1])]*(img0.size/3) + \

[(data_min[2], data_max[2])]*(img0.size/3)

# optimization params

grad_method = "L-BFGS-B"

reprs = (G_style, F_content)

minfn_args = {

"args": (self.net, self.weights, self.layers, reprs, ratio),

"method": grad_method, "jac": True, "bounds": data_bounds,

"options": {"maxcor": 8, "maxiter": n_iter, "disp": verbose}

}

# optimize

self._callback = callback

minfn_args["callback"] = self.callback

if self.use_pbar and not verbose:

self._create_pbar(n_iter)

self.pbar.start()

res = minimize(style_optfn, img0.flatten(), **minfn_args).nit

self.pbar.finish()

else:

res = minimize(style_optfn, img0.flatten(), **minfn_args).nit

return res

二、其他比较出名的应用：

1、谷歌的

效果图.png

2、雅虎的色情图片检测神经网络：效果不知道，千万不能结合爬虫去爬图片，违法的。

参考链接：

python风格变换图片_图片风格转换--深度学习介绍相关推荐

[转载] python实现语义分割_使用Keras实现深度学习中的一些语义分割模型
参考链接: Keras中的深度学习-数据预处理 Keras-Sematic-Segmentation 使用Keras实现深度学习中的一些语义分割模型. 配置 tensorflow 1.13.1+ten ...
python与医学图像处理_医学图像处理与深度学习（一）
从本文开始,作者将开始介绍图像处理的基础知识,基本的医学图像数据,并且对这些数据进行可视化处理. 利用深度学习技术,分析图像与视频,并且将之应用在诸如自动驾驶,无人机等等领域已经成为最新研究方向.在最 ...
Deep Learning with Python 读书笔记6.26 I 什么是深度学习
我感觉这样记录,对于我来说挺好的.因为我看两端对齐的语句容易走神,这样记录阅读的话,就很少出现之前的情况. 我写的初衷,也是自己来看,所以感觉写的不好的,请保留下意见,谢谢. 里面的每一个字我都看过, ...
python图片风格迁移毕设_神经风格迁移是如何运作的概述及Python实现
神经风格迁移是如何运作的概述及Python实现作者:PHPYuan 时间:2019-03-26 03:40:37 深度学习可以捕获一个图像的内容并将其与另一个图像的风格相结合,这种技术称为神经风格迁 ...
图像迁移风格保存模型_图像风格迁移也有框架了：使用Python编写，与PyTorch完美兼容，外行也能用...
原标题:图像风格迁移也有框架了:使用Python编写,与PyTorch完美兼容,外行也能用选自Medium 作者:Philip Meier 机器之心编译编辑:陈萍易于使用的神经风格迁移框架 py ...
转图片_图片怎么转PDF？图片转PDF就用这些方法吧!
图片怎么转PDF?在处理各种文件的过程中,我们有时会需要将文件转换成PDF格式来保存,就比如将Word转成PDF.PPT转成PDF.图片转成PDF等.如果是图片转PDF,我们该怎么操作呢?下面我们主要 ...
.net pdf转图片_图片转PDF怎么转？推荐两种图片转PDF方法
在我们的工作和学习中,我们有时候需要将图片转换为PDF格式的文件.因为PDF格式的文件查看起来很不容易,所以它可以确保图片文件中的信息不被泄露.那么图片转PDF怎么转呢?大家可以参考下面这两种方法,一 ...
【图片验证码识别】使用深度学习来识别captcha 验证码
谷歌图形验证码在AI 面前已经形同虚设,所以谷歌宣布退出验证码服务,这是为什么呢? 以下文章也许可以解释原因本文会通过 Keras 搭建一个深度卷积神经网络来识别 captcha 验证码,建议使用显 ...
长短时记忆神经网络python代码_零基础入门深度学习(6) - 长短时记忆网络(LSTM)
无论即将到来的是大数据时代还是人工智能时代,亦或是传统行业使用人工智能在云上处理大数据的时代,作为一个有理想有追求的程序员,不懂深度学习(Deep Learning)这个超热的技术,会不会感觉马上就o ...

python风格变换图片_图片风格转换--深度学习介绍

python风格变换图片_图片风格转换--深度学习介绍相关推荐

最新文章

热门文章