论文详读：LEMNA: Explaining Deep Learning based Security Applications

我以我ppt的内容顺序介绍一下这篇论文，希望有错误的地方大家可以帮我指出嘻嘻

1、论文出处

论文名：LEMNA: Explaining Deep Learning based Security Applications

作者：Wenbo Guo, Dongliang Mu, Jun Xu, Purui Su, Gang Wang, Xinyu Xing（Wenbo Guo是宾夕法尼亚大学计算机系博士，并且在京东安全研发中心研究时发表了此篇论文）

论文发表：Proceedings of The 25th ACM Conference on Computer and Communications Security CCS2018年优秀论文（CCS是安全领域四大顶会之一）

发表时间：2018年10月

2、概述

2.1主要内容

本文介绍了一种新的方法——LEMNA，可以为基于深度学习的安全应用提出高精度的解释，该方法提出了基于fused lasso增强的混合回归模型，解决了现有的解释技术无法处理特征依赖和非线性局部边界问题。LEMNA可以帮助安全分析人员用来理解分类器行为，排除分类错误等。总的来说LEMNA本质上是一种解释技术。

2.2研究背景

目前深度神经网络在网络安全应用上展现了强大的潜力，并且在恶意软件分类，逆向工程等都取得了很好的效果。逆向工程指的是将二进制代码转化为汇编语言或其他语言代码，实现二次开发。其作用包括检测恶意软件、易受攻击的代码片段，挖掘漏洞，生成安全补丁等。深度学习在二进制逆向工程的应用主要包括使用RNN识别函数边界，定位函数类型特征等等。恶意软件分类指的是判断软件/文件是恶性的还是良性的，深度学习在这上面的应用主要是使用MLP模型进行大规模的恶意软件分类。

但是由于神经网络的不透明特性，很难知道深度神经网络是依据什么如何做出分类决策的，因此提出了一种解释技术来解释深度神经网络是如何做出决策的，解释技术实际上就是用来找到对分类结果做出关键贡献的特征。

2.3研究动机

由于我们关心的安全领域（如二进制逆向工程）使用的深度学习模型，深度学习模型包含多层网络，复杂度高，很难知道深层神经网络是如何做出某些决定的，安全从业人员难以信任深度学习模型，并且现有的解释技术在安全领域应用得非常少，并且效果不好，因此为了改进现有解释技术存在的问题，我们提出一种解释技术——LEMNA

2.4要解决的问题

安全领域例如二进制逆向工程、恶意软件分类领域没有适用的高精度的解释技术，以及现有的解释技术存在的：无法处理特征依赖和非线性局部边界问题。

2.5遇到的挑战

安全领域对于解释的精度（准确度）要求非常高，如果安全从业人员不能排除分类错误，那么这些错误会在实践中被方法，容易是受到攻击。因此如何提高解释技术的解释精度非常重要

2.6主要解决思路

主要思路是将目标深度学习分类器视为一个黑箱，并通过模型近似推导出解释，首先引入了fusion lasso来处理特征依赖问题，接着，将融合lasso集成到混合回归模型中，逼近局部非线性决策边界，最后求解集成混合回归模型参数，最后应求解得到的模型来作出解释。

3、详细介绍

3.1研究现状

近年来，深层神经网络在构建安全应用方面显示出巨大的潜力。到目前为止，研究人员已经成功地应用深度神经网络对二进制逆向工程、恶意软件分类器进行了训练均取得了极高的准确率。

深度学习虽然在各个领域显示出巨大的潜力，但缺乏透明度限制了它在安全或安全关键领域的应用，然而网络的高度复杂性也导致了模型的低可解释性，很难理解深层神经网络是如何做出某些决定的。缺乏透明度为建立对模型的信任或有效地排除分类错误造成了关键障碍。

由于我们关心的安全领域，例如二进制逆向工程，使用的深度学习模型，深度学习模型包含多层网络，复杂度高，很难知道深层神经网络是如何做出某些决定的，因此提高安全从业人员对深度学习模型的信任度，并且从分类决策中学到知识，排除深度学习分类时出现的错误，提高准确率，需要应用解释技术来解释安全领域的深度学习问题。

目前常用的解释技术包括白盒解释技术和黑盒解释技术，白盒解释计算指的是在已知的模型结构，模型参数和训练数据下分析推断特征的重要性，主要为CNN设计的，主要用在图像领域。而黑盒解释技术指的是将分类器视为一个黑箱，并通过发送输入和观察输出来分析特征的重要性，黑盒技术的代表性模型有LIME。

3.2问题引入

现有的解释技术研究大多集中在图像分析或自然语言处理(NLP)等非安全应用领域，这些方法通常用卷积神经网络 (CNN)，然而二进制反向工程和恶意软件分析等安全应用程序都具有高级特性依赖关系，因此，递归神经网络(RNN)或多层感知器模型(MLP)用得更多。

目前，RNN上还没有很好的解释方法，并且现有的方法仍然存在解释精度很低的，另一方面，现有的方法通常有较低的解释精度。对于图像识别等应用而言，相对较低的解释精度是可以接受的。但是对于安全应用，比如二进制分析而言，即使对于一个字节的解释偏差也会导致严重的错误。

除此之外，LIME模型虽然表现的很好，但是LIME模型无法解决特征依赖问题以及不支持局部非线性决策边界。因此提出一种可以应用于安全领域，并且可以解决特征依赖问题和支持局部非线性决策边界的高精度的解释技术是非常必要的。

3.3模型提出

针对LIME模型存在的无法解决特征依赖问题以及不支持局部非线性决策边界的问题提出了fused Lasso和混合回归模型

fused lasso

Fused lasso是一种惩罚因子，可以用来约束参数，也就是说可以用来捕获特征依赖项,首先我们假设线性回归模型为：f(x)= βx+ϵ

1）根据模型定义损失函数L(f(x)，y)，这里

论文详读：LEMNA: Explaining Deep Learning based Security Applications相关推荐

cv方向论文跟读笔记《Deep Learning》（2）
<Deep Learning>From <Nature> author:Yann lecun, Yoshua bengio, Geoffery Hinton 第二课时: CNN ...
论文翻译：2021_语音增强模型压缩_Towards model compression for deep learning based speech enhancement...
论文地址:面向基于深度学习的语音增强模型压缩论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域深耕多年引用格式:Tan K, Wang D L. Towards model c ...
论文翻译七：Adversarial Transfer Learning for Deep Learning Based Automatic Modulation Classification
30天挑战翻译100篇论文坚持不懈,努力改变,在翻译中学习,在学习中改变,在改变中成长- Adversarial Transfer Learning for Deep Learning Based ...
【论文学习笔记】《A Review of Deep Learning Based Speech Synthesis》
基于深度学习的语音合成综述论文学习文章目录基于深度学习的语音合成综述论文学习 1 简介 2 语音合成概述 2.1 语音合成概念 2.2 语音合成发展历史 2.3 传统语音合成技术 2.3.1 拼接 ...
【论文笔记】Multi-task deep learning based CT imaging analysis for COVID-19 pneumonia: Classification and
声明不定期更新自己精度论文,通俗易懂,初级小白也可以理解涉及范围:深度学习方向,包括 CV.NLP.Data Fusion.Digital Twin 论文标题:Multi-task deep le ...
综述：基于深度学习的文本分类 --《Deep Learning Based Text Classification: A Comprehensive Review》总结(一)
文章目录综述:基于深度学习的文本分类 <Deep Learning Based Text Classification: A Comprehensive Review>论文总结(一) 总 ...
[论文解读] Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey
Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey 文章目录 Adversaria ...
Deep Learning based Recommender System:A Survey and New Perspectives
Deep Learning based Recommender System:A Survey and New Perspectives 论文信息:Shuai Zhang, Lina Yao, and ...
【推荐算法】深度学习推荐算法综述 Deep Learning based Recommender System: A Survey and New Perspectives
一.MLP based Recommender System 1. Deep Crossing模型 Deep Crossing模型完整的解决了从特征工程.稀疏向量稠密化.多层神经网络进行优化目标拟合等 ...

论文详读：LEMNA: Explaining Deep Learning based Security Applications

论文详读：LEMNA: Explaining Deep Learning based Security Applications相关推荐

最新文章

热门文章