本发明属于计算机视觉技术领域,涉及手写汉字行书字体的评价,尤其是一种基于深度学习的软笔书法临摹评价方法。

背景技术:

书法是我国具有几千年历史的传统艺术,是我们中华民族的特色文化代表之一,它不仅记录着我国悠久的历史文化,还是传播信息的重要方式。书法的点画结构、用笔方法和特征展现出它优美的艺术美感。临摹是提高书法水平最重要的途径,需要对着书法的范本进行反复的训练。在临摹的过程中,需要认真的观察,每个字的每个笔画都需要观察到它的精髓之处。为了达到与原帖更加接近,需要知道与原帖的差别,对临摹的字与原帖进行比较,在比较时是基于原贴与临摹习作之间的相似性来研究。

现在所具有的软笔书法临摹评价体系无论是理论成果还是实践成果都是非常缺乏的,没有形成成熟的软笔书法评价系统。这就导致对软笔书法的评价出现很多问题。现在很多书法比赛的评价都是依靠评审人员进行评审,由于参赛人员和书法汉字数目很多,导致评审人员在评价的时候难免会出现评价不公平、耗时久、评价不准确等问题,使得软笔书法评价质量得不到保证。

目前,已经出现的书法临摹评价方法大多采取人工设计的方式来进行特征的提取,通过浅层的学习来获取低层特征,并不能够提取到图像的高级特征,显然这样的评价效果并不理想。深度学习技术可以通过对大量数据集进行自主学习,学习到图像的层级特征,提取到图像的高级特征。由于Alexnet网络模仿的是人的视觉系统处理信息的方式,对信息不断迭代与抽象化,这正符合书法临摹评价中单字形态相似原则,所以采用Alexnet网络进行书法临摹评价工作。通过深度学习技术,可以大大降低传统临摹评价中特征提取的繁琐程度,并有效的降低人工特征提取时所造成的误差。所以说,利用深度学习技术研究软笔书法临摹评价体系,并将其利用到现实社会中进行书法评价,不仅能快速提高使用者书法水平,而且对传承中国文化有重要意义。

技术实现要素:

为了解决传统评价体系特征提取过于繁琐,人工提取造成误差过大的问题,本发明提供了一种基于深度学习的软笔书法临摹评价方法,

实现本发明的技术方案是:

行书文字截取:对500个行书字体的一级汉字进行截取,并通过缩放调整图片大小,从而得到文字在图片上不同的占比,来达到扩充数据集效果。

图片处理:对缩放后的每张图片中的文字进行不同角度的旋转,然后对旋转后的图片进行加噪、二值化处理。

书法评价:将临摹的行书文字保存为图片,并且调用评价模块将临摹的书法与原帖进行对比,从而得到评价结果。

评价文字模块在被调用之前需要进行模型优化训练,将500*500书样本分为测试集和训练集,通过深度卷积神经网络AlexNet网络模型对500类行书文字进行重复训练和评价,从而得到最优的权重参数以及评价模型。

在进行书法评价的时候,分析得到书法临摹评价原则中的单字形态相似原则符合Alexnet网络处理信息的方式,所以通过AlexNet网络模型获得临摹书法与原帖的特征相似度,对比相似度与所设置的阈值,得到评价结果。

在Caffe的网络框架下,通过多GPU训练的网络模型能够模拟人脑处理信息的方式提取图片高级特征,在效率和准确性方面有很大提升。

本发明的优点和有益效果:

本发明和传统的评价方法相比,具有以下优势:

(1)通过深度学习技术自主学习大量数据集,提取图片的高级特征,与浅层学习来获取图像特征相比,评价效果更好;

(2)通过深度学习技术提取图片特征,避免人工提取特征时带来的误差,提高评价水平;

(3)通过深度学习技术将临摹的书法与原帖相似度作为评价标准,大大减少了人工评价的工作量,并且深度学习提取图像特征更加高级,使得对临摹书法的评价更加公平公正。

附图说明

图1为本发明方法的流程图;

图2为行书书法范本;

图3为不同比例缩放后的文字图片;

图4为图片中a为旋转10°后的图片,b为旋转-10°后的图片;

图5为图片a为加噪0.05后的图片,b为为加噪0.08后的图片;

图6为网络迭代次数与网络损失关系图;

图7为网络迭代次数与识别准确率关系图;

图8为书法临摹的评价结果。

具体实施方式

下面结合附图并通过具体实施方法对本发明作详细的讲述。

基于深度学习的软笔书法临摹评价方法,主要包括范例文字的截取、文字的缩放、图片处理、临摹书法的评价等部分,完成临摹书法与原帖得到对比。其中文字旋转与加噪部分通过MATLAB来实现,临摹评价模块采用Caffe开源框架下Alexnet模型来实现。

文字截取:采用的书法数据集为CSAIA-HWDB1.1数据库中500个汉字的行书体,并对每个字进行截取,得到每个字的截取图片。如图2所示,为截取的一个行书文字。

图片处理:为了提高模型的鲁棒性和评价能力,需要获得更多的数据集来进行网络训练,所以对图片进行缩放、旋转、加噪处理来扩充数据集。具体的步骤如下:

步骤一:对每个行书汉字进行五个不同比例的图像缩放处理,图像的比例缩放可以用矩阵变换的形式来表示,如图3所示,为“砾”按五个不同比例进行等比例缩放后的效果;

步骤二:通过MATLAB程序对图片进行-10°到10°的旋转,间隔为1°。在图像的旋转过程中,图像的大小会发生改变,可以在图片旋转时候增大图像的范围来保证图像的所有像素点都能够得到显示。在图像进行旋转后进行插值处理,即将旋转后的空洞像素点进行填充。如图4,a为旋转10°后的“砾”字图像,b为旋转-10°后的“砾”字图像;

步骤三:对数据集加噪来进一步扩充数据集。对数据添加椒盐噪声,并对每个行书汉字的数据集都加入密度分别为0.05与0.08的椒盐噪声,如图5为相同大小且旋转角度相同下的“砾”字图片。

书法临摹评价:在评价临摹书法之前需要用Alexnet对扩充后的数据集进行训练,然后将临摹后的书法文字进行评价,调用评价的模块,得到评价结果如图8所示。模型训练的步骤如下:

步骤一:对每个书法汉字的数据集按4比1的比例分为训练集与测试集,并生成txt文件;

步骤二:将训练集与数据集转化为Caffe可用的lmdb格式的数据集;

步骤三:对网络进行初始配置;

步骤四:对Alexnet网络进行重复监督训练,并在学习的过程中根据学习误差不断调整网络各层之间的连接权重。并通过测试集进行网络测试,获取网络测试的准确率;

步骤五:网络识别的准确率开始趋于稳定,并且准确率在最高左右的时候,记录迭代次数,选择Alexnet网络迭代次数为记录的次数时的模型作为书法临摹的评价模型。

使用Alexnet网络对扩充后的500类行书体汉字数据集进行训练,网络的初始参数设置包括:基础学习率设为0.01,每100次迭代测试一次,且测试迭代次数为100次,最大迭代次数设为10万次,权重衰减为0.0005等。初始参数设置完成后开始对Alexnet网络进行监督训练,最终得到的网络损失值以及识别准确率随着训练迭代次数增加的变化关系分别在图6和图7中给出。

图6中的横坐标代表网络的迭代次数,纵坐标代表网络在训练时的损失值。由图可以看出,网络训练到65000次的时候,其损失值大约为2.89。随着网络迭代次数的不断增加,网络损失值也在不断下降。网络迭代次数为65000次~66000次的时候,其损失值下降最快。当迭代次数达到67600次的时候,网络开始收敛,其损失值也开始趋于稳定,且最终保持在0.08左右。

图7中的横坐标代表网络的迭代次数,纵坐标代表网络对行书体汉字的识别准确率。由图可以看出,网络训练到65000次的时候,其识别准确率大约为26.16%。随着网络迭代次数的不断增加,网络识别准确率也在不断上升。网络迭代次数为65000次~66000次的时候,其识别准确率上升最快。当迭代次数达到67600次的时候,网络开始收敛,网络识别准确率也开始趋于稳定,且最终保持在98.34%左右。

为了避免过多的网络迭代次数导致的过拟合现象,选择Alexnet网络迭代67600次时的模型作为书法临摹的评价模型并利用该模型对书法数据集中汉字“砾”的不同临摹作品作出评价,书法数据集中汉字“砾”的原贴及其临摹作品评价效果在图8中给出。

图8反应了同一个书法汉字“砾”,不同临摹作品的不同相似度,最上面为原贴,中间为临摹作品一,最下面为临摹作品二。其在一定程度上能够反映出书写者的临摹水平。原贴中被圈出的笔画,其笔锋形态为露锋,临摹作品一中同位置的笔锋形态虽然也为露锋,但相较原贴仍然有一定的差异,而临摹作品二的同位置笔锋形态差异则更大,其笔锋形态为藏锋,因此,最终的评价效果中,临摹作品二与原贴的相似度低于临摹作品一与原贴的相似度的。

书法特征提取matlab,基于深度学习的软笔书法临摹评价方法与流程相关推荐

  1. matlab牙齿分割,基于深度学习的缺陷牙齿图像识别方法与流程

    本发明涉及口腔医学领域,特别是一种基于深度学习的缺陷牙齿图像识别方法. 背景技术: ::缺陷牙齿的早期诊断是口腔医学领域的一大难题.早期缺陷牙齿的累及区域隐蔽,准确的判断对临床医师治疗计划的制定非常重 ...

  2. 基于linux火焰识别算法,一种基于深度学习模型的火焰识别方法与流程

    本发明属于通信领域,具体涉及一种基于深度学习模型的火焰识别方法. 背景技术: 随着我国工业化与城镇水平的不断提高,现代设施大型公共建筑朝着空间大.进深广功能复杂的多元化方向发展,这对于防烟火朝着空间大 ...

  3. 基于深度学习的显著性目标检测方法综述

    源自:电子学报       作者:罗会兰  袁璞  童康 摘 要 显著性目标检测旨在对图像中最显著的对象进行检测和分割,是计算机视觉任务中重要的预处理步骤之一,且在信息检索.公共安全等领域均有广泛的应 ...

  4. 基于深度学习的图像超分辨率方法 总结

    基于深度学习的SR方法 懒得总结,就从一篇综述中选取了一部分基于深度学习的图像超分辨率方法. 原文:基于深度学习的图像超分辨率复原研究进展 作者:孙旭 李晓光 李嘉锋 卓力 北京工业大学信号与信息处理 ...

  5. 深度学习——day38 读论文:基于深度学习的数据竞争检测方法(DeleRace计算机研究与发展 2022)

    基于深度学习的数据竞争检测方法 chap0 Introduction 本文贡献: 原文及笔记下载 chap1 DeleRace 1.1 检测框架 1.2 选取实际应用程序 1.3 特征提取 1.3.1 ...

  6. 基于深度学习的驾驶行为预测方法

    基于深度学习的驾驶行为预测方法 1 概述 2 深度学习算法 3 驾驶行为预测建模 4 结论 5 参考文献 6 python LSTM程序 7 python LSTM模型调用 1 概述 在汽车前向仿真中 ...

  7. 无失真压缩法可以减少冗余_CVPR 2020 论文概述:基于深度学习的层级式视频压缩方法...

    在 CVPR 2020 论文<Learning for Video Compression with Hierarchical Quality and Recurrent Enhancement ...

  8. 小目标检测:基于深度学习的小目标检测方法

    基于深度学习的小目标检测方法 小目标检测的难点:分辨率低.信息少,噪音多.图像模糊 解决方法:图像金字塔.特征金字塔.对包含小目标的图像进行oversampling.对小目标进行复制粘贴操作(不遮挡原 ...

  9. 基于深度学习的小目标检测方法综述

    随着深度学习的发展,基于深度学习的目标检测技术取得了巨大的进展,但小目标由于像素少,难以提取有效信息,造成小目标的检测面临着巨大的困难和挑战. 为了提高小目标的检测性能,研究人员从网络结构.训练策略. ...

最新文章

  1. 用osgEarth实现Cesium的后处理特效(1)
  2. 学习3D视觉,圈子很重要!!!
  3. Debian下配置SSH服务器的方法
  4. Windows Socket 最大连接数
  5. 给插店一个成功案例给自己一次机会
  6. 程序员吐槽_男子吐槽:35岁被裁都是低端程序员,有能力只会是一个新台阶
  7. python从字典里搜索_Python:在字典中搜索字典的函数
  8. java并发编程--一道经典多线程题的2种解法
  9. 不同sheet 选择若干条件_干货 | 不同加工条件下如何正确选择铣刀
  10. mysql savepoint 什么意思_关于MySQL中savepoint语句使用时所出现的错误
  11. Linux 删除mysql数据库失败的解决方法
  12. Flex接受任意拖拽
  13. 去除KMPplayer2.9的驴头提示
  14. aspose word 删除空行_Word:删除空行
  15. vue 配置sass、scss全局变量
  16. 加载Selenium2Library却显示红色
  17. 三星5G商用关键设备开发完成;施耐德布局物联网│IoT黑板报
  18. SharePoint 集成PowerApps和Flow教程(一,搭建PowerApps 环境)
  19. 读书笔记 | 财务会计理论(第7版 William R.Scott)(中)
  20. LNMP搭建HDwiki

热门文章

  1. 第五人格服务器维护中怎么进游戏,第五人格游戏进不去黑屏怎么解决 第五人格游戏进不去黑屏解决攻略...
  2. HCTF 2017 bin Level1 Evr_Q Writeup
  3. 笔记本电脑wifi怎么连接
  4. 三国群英传M玩亚服好还是台服好?服务器选择推荐
  5. C++ MFC打开图片并进行简单算法处理
  6. 爬虫学习(14):selenium自动化测试(三):鼠标和键盘操作
  7. 硕士毕业去一线城市的企业好,还是去三线城市做公务员好?
  8. 用什么擦地最干净脑筋急转弯_小学生语文试卷:为什么秋天大雁要飞回南方?答案让人“喷饭”...
  9. 苹果官方揭秘:这个强大的相册功能是如何实现的?
  10. 关于左对齐和左对齐的一些简单理解和杨辉3角的算法思想