作者 | 李秋键

责编 | 晋兆雨

头图 | CSDN下载自视觉中国

引言:人脸图像的生成在各个行业有着重要应用,例如刑事调查、人物设计、教育培训等。然而一幅逼真的人脸肖像,对于职业画家也要至少数小时才能绘制出来;对于从未接触过绘画的新手,就更是难如登天了。新手绘制出来的人脸草图往往非常简陋抽象,甚至有不匀称、不完整。但如果使用智能人脸画板,无疑是有如神助。

本项目主要来源于中科院和香港城市大学的一项研究DeepFaceDrawing,论文标题是《DeepFaceDrawing: DeepGeneration of Face Images from Sketches》

具体效果如下图可见:

实验前的准备

首先我们使用的python版本是3.6.5所用到的模块如下:

Pyqt5模块:PyQt5是基于Digia公司强大的图形程式框架Qt5的python接口,由一组python模块构成。PyQt5本身拥有超过620个类和6000函数及方法。在可以运行于多个平台,包括:Unix, Windows, and Mac OS。

  • opencv是将用来进行图像处理和生成。

  • numpy模块用来处理矩阵运算。

  • Jittor模块国内清华大学开源的深度学习框架。

  • _thread是多线程库。

网络模型的定义和训练

首先这个图像合成模块采用了一种利用发生器和鉴别器的GAN结构。从融合的特征图生成真实的人脸图像。鉴别器采用多尺度鉴别方式:对输入进行尺度划分,特征图和生成的图像在三个不同的层次上,经过三个不同的过程。:

(1)权重网络层和损失定义:

def weights_init_normal(m):classname = m.__class__.__name__ifclassname.find("Conv") != -1:jt.init.gauss_(m.weight,0.0, 0.02)elifclassname.find("BatchNorm") != -1:jt.init.gauss_(m.weight,1.0, 0.02)jt.init.constant_(m.bias,0.0)def get_norm_layer(norm_type='instance'):if (norm_type == 'batch'):norm_layer = nn.BatchNormelif (norm_type == 'instance'):norm_layer =nn.InstanceNorm2delse:raiseNotImplementedError(('normalization layer [%s] is not found' % norm_type))return norm_layerclass MSELoss:def __init__(self):passdef __call__(self, output,target):from jittor.nn importmse_lossreturn mse_loss(output,target)class BCELoss:def __init__(self):passdef __call__(self, output,target):from jittor.nn importbce_lossreturn bce_loss(output,target)

(2)模型特征编解码:

特征匹配模块包含5个译码网络,以compact作为输入由分量流形得到的特征向量,并将其转换为对应的特征向量为后续生成的特征图的大小。

def define_part_encoder(model='mouth', norm='instance', input_nc=1,latent_dim=512):norm_layer =get_norm_layer(norm_type=norm)image_size = 512if 'eye' in model:image_size = 128elif 'mouth' in model:image_size = 192elif 'nose' in model:image_size = 160elif 'face' in model:image_size = 512else:print("Whole Image!!")net_encoder =EncoderGenerator_Res(norm_layer,image_size,input_nc, latent_dim)  # input longsize 256 to 512*4*4    print("net_encoder of part"+model+" is:",image_size)return net_encoderdef define_part_decoder(model='mouth', norm='instance', output_nc=1,latent_dim=512):norm_layer =get_norm_layer(norm_type=norm)image_size = 512if 'eye' in model:image_size = 128elif 'mouth' in model:image_size = 192elif 'nose' in model:image_size = 160else:print("Whole Image!!")net_decoder =DecoderGenerator_image_Res(norm_layer,image_size,output_nc, latent_dim)  # input longsize 256 to 512*4*4print("net_decoder to imageof part "+model+" is:",image_size)return net_decoderdef define_feature_decoder(model='mouth', norm='instance', output_nc=1,latent_dim=512):norm_layer =get_norm_layer(norm_type=norm)image_size = 512if 'eye' in model:image_size = 128elif 'mouth' in model:image_size = 192elif 'nose' in model:image_size = 160else:print("Whole Image!!")net_decoder =DecoderGenerator_feature_Res(norm_layer,image_size,output_nc, latent_dim)  # input longsize 256 to 512*4*4print("net_decoder to imageof part "+model+" is:",image_size)# print(net_decoder)return net_decoderdef define_G(input_nc, output_nc, ngf, n_downsample_global=3,n_blocks_global=9, norm='instance'):norm_layer =get_norm_layer(norm_type=norm)    netG = GlobalGenerator(input_nc,output_nc, ngf, n_downsample_global, n_blocks_global, norm_layer)return netG

图形界面的定义

在这篇论文中,作者一方面将人脸关键区域(双眼、鼻、嘴和其他区域)作为面元,学习其特征嵌入,将输入草图的对应部分送到由数据库样本中面元的特征向量构成的流形空间进行校准。另一方面,参考 pix2pixHD [5]的网络模型设计,使用 conditional GAN 来学习从编码的面元特征到真实图像的映射生成结果。

(1)鼠标绘制函数的定义:

class OutputGraphicsScene(QGraphicsScene):def __init__(self, parent=None):QGraphicsScene.__init__(self, parent)# self.modes = mode_listself.mouse_clicked = Falseself.prev_pt = Noneself.setSceneRect(0,0,self.width(),self.height())# self.masked_image = Noneself.selectMode = 0# save the history of editself.history = []self.ori_img = np.ones((512,512, 3),dtype=np.uint8)*255self.mask_put = 1 # 1 marksuse brush while 0 user eraseself.convert = False# self.setPos(0 ,0)self.firstDisplay = Trueself.convert_on = Falsedef reset(self):self.convert = Falseself.ori_img = np.ones((512,512, 3),dtype=np.uint8)*255self.updatePixmap(True)self.prev_pt = Nonedef setSketchImag(self,sketch_mat, mouse_up=False):self.ori_img =sketch_mat.copy()self.image_list = []self.image_list.append(self.ori_img.copy() )def mousePressEvent(self,event):if not self.mask_put orself.selectMode == 1:self.mouse_clicked =Trueself.prev_pt = Noneelse:self.make_sketch(event.scenePos())def make_sketch_Eraser(self,pts):if len(pts)>0:for pt in pts:cv2.line(self.color_img,pt['prev'],pt['curr'],self.paint_color,self.paint_size)cv2.line(self.mask_img,pt['prev'],pt['curr'],(0,0,0),self.paint_size )self.updatePixmap()def modify_sketch(self, pts):if len(pts)>0:for pt in pts:cv2.line(self.ori_img,pt['prev'],pt['curr'],self.paint_color,self.paint_size)self.updatePixmap()def get_stk_color(self, color):self.stk_color = colordef erase_prev_pt(self):self.prev_pt = Nonedef reset_items(self):for i inrange(len(self.items())):item = self.items()[0]self.removeItem(item)def undo(self):iflen(self.image_list)>1:num =len(self.image_list)-2self.ori_img =self.image_list[num].copy()self.image_list.pop(num+1)self.updatePixmap(True)def getImage(self):returnself.ori_img*(1-self.mask_img)  +self.color_img*self.mask_imgdefupdatePixmap(self,mouse_up=False):sketch = self.ori_imgqim = QImage(sketch.data,sketch.shape[1], sketch.shape[0], QImage.Format_RGB888)if self.firstDisplay :self.reset_items()self.imItem =self.addPixmap(QPixmap.fromImage(qim))self.firstDispla = Falseelse:self.imItem.setPixmap(QPixmap.fromImage(qim))def fresh_board(self):print('======================================================')while(True):if(self.convert_on):print('======================================================')time.sleep(100)iter_start_time =time.time()self.updatePixmap()print('TimeSketch:',time.time() - iter_start_time)

(2)GUI界面:其核心思路并非直接用输入草图作为网络生成条件,而是将人脸进行分块操作后利用数据驱动的思想对抽象的草图特征空间进行隐式建模,并在这个流形空间中找到输入草图特征的近邻组合来重构特征,进而合成人脸图像。

class WindowUI(QtWidgets.QMainWindow,Ui_SketchGUI):def __init__(self):super(WindowUI,self).__init__()self.setupUi(self)self.setEvents()self._translate =QtCore.QCoreApplication.translateself.output_img = Noneself.brush_size =self.BrushSize.value()self.eraser_size =self.EraseSize.value()self.modes = [0,1,0] #0marks the eraser, 1 marks the brushself.Modify_modes = [0,1,0]#0 marks the eraser, 1 marks the brushself.output_scene =OutputGraphicsScene()self.output.setScene(self.output_scene)self.output.setAlignment(Qt.AlignTop | Qt.AlignLeft)self.output.setVerticalScrollBarPolicy(Qt.ScrollBarAlwaysOff)self.output.setHorizontalScrollBarPolicy(Qt.ScrollBarAlwaysOff)self.output_view =QGraphicsView(self.output_scene)#self.output_view.fitInView(self.output_scene.updatePixmap())self.input_scene =InputGraphicsScene(self.modes, self.brush_size,self.output_scene)self.input.setScene(self.input_scene)self.input.setAlignment(Qt.AlignTop | Qt.AlignLeft)self.input.setVerticalScrollBarPolicy(Qt.ScrollBarAlwaysOff)self.input.setHorizontalScrollBarPolicy(Qt.ScrollBarAlwaysOff)self.input_scene.convert_on= self.RealTime_checkBox.isChecked()self.output_scene.convert_on= self.RealTime_checkBox.isChecked()self.BrushNum_label.setText(self._translate("SketchGUI",str(self.brush_size)))self.EraserNum_label.setText(self._translate("SketchGUI",str(self.eraser_size)))self.start_time =time.time()# self.# try:#     # thread.start_new_thread(self.output_scene.fresh_board,())#    thread.start_new_thread(self.input_scene.thread_shadow,())# except:#     print("Error: unable to startthread")# print("Finish")def setEvents(self):self.Undo_Button.clicked.connect(self.undo)self.Brush_Button.clicked.connect(self.brush_mode)self.BrushSize.valueChanged.connect(self.brush_change)self.Clear_Button.clicked.connect(self.clear)self.Eraser_Button.clicked.connect(self.eraser_mode)self.EraseSize.valueChanged.connect(self.eraser_change)self.Save_Button.clicked.connect(self.saveFile)#weight barself.part0_Slider.valueChanged.connect(self.changePart)self.part1_Slider.valueChanged.connect(self.changePart)self.part2_Slider.valueChanged.connect(self.changePart)self.part3_Slider.valueChanged.connect(self.changePart)self.part4_Slider.valueChanged.connect(self.changePart)self.part5_Slider.valueChanged.connect(self.changAllPart)self.Load_Button.clicked.connect(self.open)self.Convert_Sketch.clicked.connect(self.convert)self.RealTime_checkBox.clicked.connect(self.convert_on)self.Shadow_checkBox.clicked.connect(self.shadow_on)self.Female_Button.clicked.connect(self.choose_Gender)self.Man_Button.clicked.connect(self.choose_Gender)self.actionSave.triggered.connect(self.saveFile)def mode_select(self, mode):for i inrange(len(self.modes)):self.modes[i] = 0self.modes[mode] = 1def brush_mode(self):self.mode_select(1)self.brush_change()self.statusBar().showMessage("Brush")def eraser_mode(self):self.mode_select(0)self.eraser_change()self.statusBar().showMessage("Eraser")def undo(self):self.input_scene.undo()self.output_scene.undo()def brush_change(self):self.brush_size =self.BrushSize.value()self.BrushNum_label.setText(self._translate("SketchGUI",str(self.brush_size)))if self.modes[1]:self.input_scene.paint_size = self.brush_sizeself.input_scene.paint_color = (0,0,0)self.statusBar().showMessage("Change Brush Size in ",self.brush_size)def eraser_change(self):self.eraser_size =self.EraseSize.value()self.EraserNum_label.setText(self._translate("SketchGUI",str(self.eraser_size)))if self.modes[0]:print( self.eraser_size)self.input_scene.paint_size = self.eraser_sizeself.input_scene.paint_color = (1,1,1)self.statusBar().showMessage("Change Eraser Size in ",self.eraser_size)def changePart(self):self.input_scene.part_weight['eye1'] = self.part0_Slider.value()/100self.input_scene.part_weight['eye2']= self.part1_Slider.value()/100self.input_scene.part_weight['nose'] = self.part2_Slider.value()/100self.input_scene.part_weight['mouth'] = self.part3_Slider.value()/100self.input_scene.part_weight[''] = self.part4_Slider.value()/100self.input_scene.start_Shadow()#self.input_scene.updatePixmap()def changAllPart(self):value =self.part5_Slider.value()self.part0_Slider.setProperty("value", value)self.part1_Slider.setProperty("value", value)self.part2_Slider.setProperty("value", value)self.part3_Slider.setProperty("value", value)self.part4_Slider.setProperty("value", value)self.changePart()def clear(self):self.input_scene.reset()self.output_scene.reset()self.start_time =time.time()self.input_scene.start_Shadow()self.statusBar().showMessage("Clear Drawing Board")def convert(self):self.statusBar().showMessage("Press Convert")self.input_scene.convert_RGB()self.output_scene.updatePixmap()def open(self):fileName, _ =QFileDialog.getOpenFileName(self, "Open File",QDir.currentPath(),"Images Files (*.*)") #jpg;*.jpeg;*.pngif fileName:image =QPixmap(fileName)mat_img =cv2.imread(fileName)mat_img = cv2.resize(mat_img,(512, 512), interpolation=cv2.INTER_CUBIC)mat_img =cv2.cvtColor(mat_img, cv2.COLOR_RGB2BGR)if image.isNull():QMessageBox.information(self, "Image Viewer","Cannotload %s." % fileName)return#cv2.imshow('open',mat_img)self.input_scene.start_Shadow()self.input_scene.setSketchImag(mat_img)def saveFile(self):cur_time =strftime("%Y-%m-%d-%H-%M-%S", gmtime())file_dir ='./saveImage/'+cur_timeif notos.path.isdir(file_dir) :os.makedirs(file_dir)cv2.imwrite(file_dir+'/hand-draw.jpg',self.input_scene.sketch_img*255)cv2.imwrite(file_dir+'/colorized.jpg',cv2.cvtColor(self.output_scene.ori_img,cv2.COLOR_BGR2RGB))print(file_dir)def convert_on(self):# ifself.RealTime_checkBox.isCheched():print('self.RealTime_checkBox',self.input_scene.convert_on)self.input_scene.convert_on= self.RealTime_checkBox.isChecked()self.output_scene.convert_on= self.RealTime_checkBox.isChecked()def shadow_on(self):_translate =QtCore.QCoreApplication.translateself.input_scene.shadow_on =not self.input_scene.shadow_onself.input_scene.updatePixmap()ifself.input_scene.shadow_on:self.statusBar().showMessage("Shadow ON")else:self.statusBar().showMessage("Shadow OFF")def choose_Gender(self):ifself.Female_Button.isChecked():self.input_scene.sex = 1else:self.input_scene.sex = 0self.input_scene.start_Shadow()

总结

这里给出模型的体验网址:

http://www.geometrylearning.com:3000/index_621.html

该方法核心亮点之一,便是以多通道特征图作为中间结果来改善信息流。从本质上看,这是将输入草图作为软约束来替代传统方法中的硬约束,因此能够用粗糙甚至不完整的草图来生成高质量的完整人脸图像。

反思DeepFaceDrawing

1)画不出丑脸:

从图中可以看出,即使给出丑陋的草图,输出的也会是平均来说漂亮的人脸,这大概是因为所用的训练数据集都是名人,平均“颜值”较高,因此神经网络学到了一种漂亮的平均;这能算是一种在“颜值上的”数据不平衡问题吗。

2)安全问题

比如人脸支付场景中,可能存在利用该项技术盗刷的问题。随着人脸活体检测技术的发展,这种隐患应该能得以有效避免。

3)技术攻击性

相比于Deepfake,本文的DeepFaceDrawing应该算是相对无害的。

4)商业价值

如论文作者所说,这项技术在犯罪侦查、人物设计、教育培训等方面都可以有所作为。期待有一天这项技术更加通用,这样一来其商业价值会更大。

完整代码:

链接:https://pan.baidu.com/s/1ARIzPEbUSNzAIdPsRl6h-A

提取码:4llk

作者简介
李秋键,CSDN 博客专家,CSDN达人课作者。硕士在读于中国矿业大学,开发有taptap安卓武侠游戏一部,vip视频解析,文意转换工具,写作机器人等项目,发表论文若干,多次高数竞赛获奖等等。

更多精彩推荐
☞中招!330 万台老年机被植木马,背后黑幕细思极恐
☞什么?性能强大的 M1 芯片不支持 Docker ?
☞恭喜您被选为CSDN插件内测用户:点此领取福利
☞关于动态规划,你想知道的都在这里了!
☞一文告诉你雾计算与云计算的区别及对物联网的价值!
☞28岁年轻操盘手,加密市场“空手套白狼”成就亿万身家
点分享点点赞点在看

用 Python 画自画像?看完我笑了相关推荐

  1. DayDayUp:那些属于程序猿江湖的鄙视链(看完别笑^~^,哈哈,haha)

    DayDayUp:那些属于程序猿江湖的鄙视链(看完别笑^~^,哈哈,haha) 导读:程序猿江湖的鄙视链哈,老婆漂亮的程序猿>老婆不漂亮的程序猿>有女朋友的程序猿>单身程序狗:在单身 ...

  2. 一位北大教授对韩国的评价,看完后笑抽

    一位北大教授对韩国的评价,看完后笑抽 据说此文因为涉嫌"伤害了韩国人民的感情",曾经遭到韩国外交部抗议,但本着"精彩,不容错过"的原则,再加上此文也体现了许多中 ...

  3. Python学习必备:10个奇妙的Python库,看完后我惊呆了

    前言 10个奇妙的Python库,看完后我惊呆了! 让我们愉快地开始吧~编程学习资料点击免费领取 开发工具 Python版本: 3.6.4 相关模块: socket模块: textblob模块: py ...

  4. python正则表达式,看完这篇文章就够了...

    正则的噩梦... 正则表达式这东西,你说它简单它也简单,你说它难吧,确实不容易.为什么?这东西就是死记硬背的.背过了相关的语法,使用起来就so easy.但记不熟语法,就犯难了.网上关于python正 ...

  5. Python正则表达式,看完这篇文章就够了...#华为云·寻找黑马程序员#

    正则表达式简介 正则表达式,是一个特殊的字符序列,又称规则表达式(英语:Regular Expression,在代码中常简写为regex.regexp 或RE),本质而言是一种小型的,高度专业化的编程 ...

  6. python就业方向-看完Python这五大就业方向的薪资待遇,你选择哪个?

    Python因为简单.入门快,成为了不少程序员入门的首选语言. 目前Python加入了小学生的教材,就连国家二级计算机证也需要学习Python了!由此可见这几年Python的火爆程度. 今天小编整理了 ...

  7. 多年编码经验血泪史总结,你若想学Python,必须看完这几点再做决定

    相信大家都有感触,这几年来编程是真的很出圈!网上到处都是九块九零基础成为编程大神,朋友圈随时可见的Python广告,下面乌泱泱的全是评论连少儿都准备学编程,代码都从娃娃抓起- 偶尔我也会好奇,现在真有 ...

  8. 学习python了,看完这篇文章,你的Linux基础就差不多了(附导图】

    提醒:本文稍微过长,请细读 一.Linux介绍 1.操作系统的发展 在这里还是要推荐下我自己建的Python开发学习群:301056051,群里都是学Python开发的,如果你正在学习 Python ...

  9. 30岁开始学python和liunx_学习python了,看完这篇文章,你的Linux基础就差不多了

    前言 这篇文章基于传智播客的2016年的gitbook资料和视频资料,同时也融合了2018年的视频和课件资料中的一些内容,即以2016年的资料为蓝本,2018年的资料为辅助编写的. 提醒:本文稍微过长 ...

最新文章

  1. java 读取txt字符串_java读取txt文档需要匹配文档中的字符串
  2. 姜宁谈红帽绩效考核:不关心员工具体做什么
  3. 交通警察手势信号(动画演示)
  4. 京东数科郑宇获评“数据挖掘领域”全球最具影响力科学家
  5. 计算机组成原理脱机运算器实验数据,实验三:脱机运算器实验报告.pdf
  6. python中使用连续关系运算符_解释一下Python中的关系运算符
  7. 说说IUnitOfWork~DbContext对象的创建应该向BLL层公开
  8. 差速转向机器人数学模型
  9. python语言是编程还是脚本_编程语言和脚本语言有什么区别?
  10. 支付宝小程序使用 icontfont字体图标
  11. matplotlib的学习,全是源码,勿喷
  12. 总结 27 类深度学习主要神经网络:结构图及应用
  13. r730xd服务器重装系统后风扇声音大,重装Win10系统后散热风扇噪音特别大的处理方法...
  14. java $ 怎样用_jsp中$是什么意思?怎么用?
  15. 【葡萄城报表案例分享】项目施工进度报告 – 树形报表
  16. WannaCry勒索病毒分析过程**中**
  17. 群辉服务器如何清理缓存和文件,群晖的硬盘缓存到底肿么清理
  18. 不想长期打工,可做这5个冷门生意,知道的人不多,利润却不错
  19. 小米遭虚假评价后索赔 100 万元
  20. ArchiCAD与Revit深度对比

热门文章

  1. 中科院博士因论文致谢走红后,回到母校演讲再刷屏!网友:是对寒门学子最好的激励...
  2. SAP QM 检验批录入了结果以后不能再Reset检验计划了?
  3. SAP MM 采购发票上的价格与采购订单上价格的差异
  4. SAP RETAIL Plant Group里的特性
  5. AI 发展方向大争论:混合AI ?强化学习 ?将实际知识和常识整合到AI中 ?
  6. 谷歌发布TensorFlow,用于测试人工智能模型的隐私保护
  7. 为了读懂你,AI究竟有多努力?
  8. 如何构建一个成功的AI PoC(概念验证项目)
  9. 推荐系统数据集大列表
  10. 【SAP技术】SAP MM 如何看一个自定义移动类型是复制哪个标准移动类型而创建的?