点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

简介

水印作为一种保护版权的有效方式被广泛地应用于海量的互联网图像,针对水印的各种处理显得越来越重要,比如水印的检测和水印的去除与反去除。在这里我们和大家分享一下业余期间在水印智能化处理上的一些实践和探索,希望可以帮助大家在更好地做到对他人图像版权保护的同时,也能更好地防止自己的图像被他人滥用。

我们大家在日常生活中如果下载和使用了带有水印的互联网图像,往往既不美观也可能会构成侵权。为了避免使用带有水印的图像带来的各种影响,最直接的做法就是将带有水印的图像找出来丢弃不用,此外还有一种不推荐的做法就是去掉图像上的水印后再使用。

接下来我们将会围绕上述两种大家常见的做法展开,首先介绍如何利用深度学习技术快速搭建一个水印检测器,实现水印的自动检测,同时我们还会进一步展示在水印检测的基础上如何利用深度学习技术设计一个水印去除器,自动将图像上的水印去除。

一个包罗万象的水印数据集

无论是搭建水印检测器或是水印去除器,都需要海量水印图像作为数据基础。然而现实中并没有直接可以使用的水印图像数据集。因此,我们的首要任务是构建一个水印图像数据集。首先我们要收集各式各样的水印,为了保证后续模型良好的泛化性能,水印的种类要尽可能的多,水印样式也要尽可能的丰富。

我们一共收集了80种来自于公司、组织和个人的水印,包括了中文、英文和logo等不同样式。接下来就是制作带水印的图像,为了保证图像数据的一般性,我们将公开的PASCAL VOC 2012数据集的图像作为原始的无水印图像,然后利用图像处理工具将收集的80种水印以随机的大小、位置和透明度打在原始图像上,同时记录下水印的位置信息,从而得到第一个大规模的水印图像数据集。

水印数据集的80%被划分为训练集,剩余的20%被划分为测试集,为了适应现实场景中需要机器自动检测和去除从未见过的水印的需求,我们确保训练集中的水印不会出现在测试集中,这样可以很好地模拟现实生活中的使用场景。现在水印图像数据集已经准备就绪,接下来就是如何去搭建水印检测器和去除器。

 

能够一眼看穿各类水印的检测器

水印在图像中的视觉显著性很低,具有面积小,颜色浅,透明度高等特点,带水印图像与未带水印图像之间的差异往往很小,区分度较低。为了构建一个有效的水印检测器,我们将图像水印检测问题转化为一种特殊的单目标检测任务,即判断图像中是否有水印这一单目标存在。

当前基于深度学习的目标检测模型有很多,可以分为以Faster R-CNN为代表的两阶段目标检测算法和以YOLO和RetinaNet等为代表的单阶段目标检测算法。前者是先由算法生成一系列待检测目标的候选框,再通过卷积神经网络进行候选框的分类;后者则不用产生候选框,直接将目标边框定位的问题转化为回归问题处理。一般来说单阶段的算法在检测速度上会更快,但检测精度上会有所下降。我们在这里分别基于Faster R-CNN、YOLOv2和RetinaNet这三种目标检测算法来搭建水印检测器,从对比的结果来看,三种方法都展现了令人满意的检测效果,其中以RetinaNet最优。

为了更加直观地展示我们搭建的基于RetinaNet的水印检测器的效果,我们将测试集上的水印检测结果可视化,蓝色的框是实际的水印区域,红色的框是检测器定位的水印区域,从可视化结果可以看出,对于未出现在训练集中的水印,我们的水印检测器依然可以一眼就看穿。有了这样一款水印检测器,我们就可以在海量图像中快速又准确地检测出带水印的图像。

从检测到去除

如果只是利用AI来自动检测水印,是不是总感觉少了点什么?接下来我们在水印检测的基础上往前再走一步,利用AI实现水印的自动去除。因为水印在图像上的面积较小,所以直接对整幅图像进行水印去除显得过于粗暴,也会严重拖慢去除速度。针对这种情况我们结合水印检测设计了更贴合实际操作的水印处理流程,我们先通过水印检测器检测出水印区域,然后对水印区域进行水印去除操作。

水印去除问题可以看作是一个从图像到图像的转换问题,即将带水印的图像转换为无水印的图像。这里我们使用全卷积网络来搭建水印去除器,实现这种图像到图像的转换。全卷积网络的输入是带水印的图像区域,经过多层卷积处理后输出无水印的图像区域,我们希望网络输出的无水印图像能够和原始的无水印图像尽可能的接近。

为了尽可能提升网络输出无水印图像的质量,我们采用U-net结构替换了传统的编解码器结构,将输入信息添加到输出中,从而尽可能保留了图像的背景信息。同时我们采用感知损失(Perceptual Loss)和一范数损失(L1 Loss)相结合的方式替换传统的均方误差损失(MSE Loss),使输出的无水印图像在细节和纹理上能够更贴近原图。

我们将水印去除器在测试集上的一些去水印效果可视化,左列是输入的水印区域,右列是输出的无水印区域。从可视化的结果可以看出对未知水印的去除效果还是不错的。

结论

针对水印的各种处理一直是研究的热点,也吸引了越来越多的关注。本文介绍了如何通过当前流行的深度学习技术来搭建水印的检测器和去除器,实现对水印的智能处理。

在后续的文章中,我们会进一步介绍一种更强大的水印去除器,也会提出一些对水印反去除的思考。值得注意的是,版权保护是大家一直要坚持的事情,水印去除的研究目的更多是为了通过攻击水印来验证其是否有效,从而促进水印反去除能力的提升。保护版权,AI有责

一些资料

[1] Large-scale visible watermark detection and removal with deep convolutional networks

[2] Focal loss for dense object detection

[3] U-net: Convolutional networks for biomedical image segmentation


下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

AI技术在图像水印处理中的应用相关推荐

  1. On the Effectiveness of Visible Watermarks 利用AI技术去除图像水印

    我的个人微信公众号: Microstrong 微信公众号ID: MicrostrongAI 微信公众号介绍: Microstrong(小强)同学主要研究机器学习.深度学习.计算机视觉.智能对话系统相关 ...

  2. Clarifai的AI可检测图像和视频中的不合规内容

    文章来源:ATYUN AI平台 在互联网上过滤色情,毒品,血腥和其他令人反感的内容并不容易.Facebook目前在全球拥有7500名内容版主,而2017年5月为4500名.而在4月份,谷歌旗下的You ...

  3. 如何利用深度学习技术处理图像水印?

    作者 | 李翔 转载自公众号视说AI(ID: techtalkai) 作者简介:李翔,国内某互联网大厂AI民工,前携程酒店图像技术负责人,主导并参与一系列图像智能化算法的研发与落地工作.在ICCV和C ...

  4. AI技术在智能海报设计中的应用

    背景 在视觉设计领域中,设计师们往往会因为一些简单需求付出相当多的时间,比如修改文案内容,设计简单的海报版式,针对不同机型.展位的多尺寸拓展等.这些工作需要耗费大量的时间.人力成本(5~6张/人日), ...

  5. AI技术在音乐类产品中的应用场景!

    自动标注.平滑过渡.音乐鉴权.AI创作,当AI技术应用于音乐行业为人类的精神文化与娱乐生活带来便利和更多选择时,也是一件让人激动不已的事情. 随着深度学习算法的出现.大数据和5G技术的成熟,AI人工智 ...

  6. 谷歌开源语音识别AI技术,可以从人群中区分每个人的发言

    虽然机器语音识别的准确率已经很高,但是从一群人嘈杂的沟通交流中区分每个人说了什么,对于机器来说还是一个艰巨的挑战.Speaker Diarization(发言者语音片段切分归类)是一个将群组发言中不同 ...

  7. 生成对抗网络玩转图像水印

    作者:李翔 来源:视说AI 01 写在前面 当前互联网飞速发展,越来越多的公司.组织和个人都选择在网上展示和分享图像.为了保护图像版权,大家都会选择在图像上打上透明或者半透明的水印.随着水印被广泛地使 ...

  8. 情感AI技术厉害了!看了才知道!!

    事实上,近年来随着情感AI技术发展突飞猛进,央视节目中的特种兵测谎场景只是小试牛刀.在真实世界中,情感AI技术已经开始 在安防.广告.教育等与特殊人群密切相关的行业中得到初步应用. 而在被视为高端服务 ...

  9. 利用AI技术自动测试游戏

    1.引子 近年来,游戏AI已从一种"伪智能"迭代成了真正的人工智能.3年前AlphaGo的成功只是证明了AI技术在游戏领域取得了巨大的发展,但另一方面AI技术对整个游戏行业的帮助仍 ...

最新文章

  1. 机器学习笔记:Transformer
  2. 线性表(一)——顺序表
  3. Tomcat 部署了web项目中文乱码
  4. easyui验证:validatebox
  5. python换循环颜色_python – 增加matplotlib颜色循环
  6. gitlab与已安装nginx(tengine)冲突解决方案,使用自己安装的nginx(tengine)
  7. ZOJ-3704 I am Nexus Master! 模拟
  8. android UI进阶之仿iphone的tab效果(二)
  9. 解决ipad,ios录屏保存失败-5823
  10. [译] Vue: scoped 样式与 CSS Module 对比
  11. 【Java 基础】字符串(String、StringBuilder),日期(Date、SimpleDateFormat、Calendar)
  12. Web表单设计:表单结构
  13. 微信小程序防止点击事件多次请求接口
  14. PearOS官网下载\梨子系统
  15. codesensor:将代码转化为ast后再转化为文本向量
  16. 题解 P1757 【通天之分组背包】
  17. airpods麦克风测试软件,苹果AirPods新维修工具上线:可区分是污垢堵塞还是故障...
  18. idm 无法下载此文件 备注: SSL_connect error 5
  19. 在中国人群中感染率最高的高危型HPV病毒是HPV16、HPV52和HPV58
  20. 文献分享:个体化治疗中新抗原的识别鉴定 Identification of neoantigens for individualed therapeutic cancer vaccines

热门文章

  1. 200万?程序员刚拿下华为Offer,这些技巧你必须知道!
  2. AI从入门到放弃2:CNN的导火索,用MLP做图像分类识别?
  3. 中国首场AI芯片产业峰会成功举办 GTIC 2018热度空前
  4. 资源 | 想用Python学机器学习?Google大神替你写好了所有的编程示范代码
  5. 又双叒有兄弟因为 YYYY-MM-dd 被叫去加班了...
  6. Dubbo 和 HSF 在阿里的实践:携手走向下一代云原生微服务
  7. 说实话,DataGrip真得牛逼,只是你不会用而已~
  8. SpringBoot第二十四篇: springboot整合docker
  9. 阿里算法,浙大博士带你写项目经历!
  10. GIA张怡:关于小白入门AI算法工程师的直播分享