DeepFlow: Deep Learning-Based Malware Detection by Mining Android Application for Abnormal Usage 2
B.恶意和良性的应用程序
我们对3000个良性应用程序和8000个恶意应用程序进行特征提取,其中良性应用程序是从
谷歌播放商店,涵盖了最受欢迎的应用程序在各种类别,后者包括来自恶意软件家族
Android恶意软件基因组计划[21]和VirusShare[17]濁
因为我们假设谷歌Play Store中流行的应用程序是合法的,所以我们认为从这些良性应用程序中提取的流构成了敏感数据的“正常”使用。相反,从恶意应用中提取的数据流揭示了敏感数据的“异常”使用。我们的研究结合了良性和恶意应用程序的数据流分析,不仅可以通过与现有恶意软件的相似性,还可以通过与良性应用程序的差异性来检测新的恶意软件。
c功能粒度
FlowDroid提取的数据流的原始特性包含完整的源和接收方法名。但是,Android库中有成千上万的source和sink方法,而在app中调用的却很少。举个例子,如果我们将这些方法之间的数据流视为特征,特征向量可以是:
功能(应用)= (src_method1→sink_method1, src_method1→sink_method2,尀,src_methodm→sink_methodn-1, src_methodm→sink_methodn)
其中m和n很大。当应用程序中出现源方法和汇聚方法之间的数据流时,其在特征向量中的值为1,否则其值为0。我们可以很容易地推断出,特征向量中的大部分值都是0。这意味着特征向量太稀疏而不能产生好的结果。为了获得更好的特征向量,我们应用Rashofer等人在[18]中提出的SUSI技术对源和sink方法进行分类。
SUSI是一种自动机器学习指导方法,用于直接从an的代码中识别源和汇Android API。此外,SUSI将已识别的源和汇分为17个源类别和19个汇类别(如图2所示)以显示附加信息,说明在何处泄漏了哪些信息。通过这种方式,我们拥有323结合FlowDroid和SUSI技术,每个app的功能可以表示为一个向量:
功能(应用)= (src_category1→sink_ category1, src_ category1→sink_类别2,尀,src_ category17→sink_ category18, src_ c ategory17→sink_ category19)。
注意,每个特性都是二进制的,这表明当一个数据流特性在应用程序中出现时,它的值是1,否则,它的值是0。
FlowDroid对其执行静态数据流分析,并从所有敏感源提取所有敏感数据流到所有敏感接收器。接下来,DeepFlow使用SUSI技术对提取的流进行分类,以获得特征。在对第3节描述的特征向量进行收集和正则化后,DeepFlow将其输入到DBN深度学习模型中进行分类。DBN模型的训练步骤如图3所示,基于两个爬虫模块,其中一个模块用于从已知的恶意软件源(如Genome、VirusTotal和Drebin)中抓取恶意软件,另一个模块用于从谷歌Play中抓取benignware商店。这样,DeepFlow就可以确保它在检测不断出现的新型恶意软件时的准确性。此外,DeepFlow向用户执行检测结果,包括详细的敏感数据流信息和app的实际分类。
(检出率),除F1评分外,用来评价我们的实验。精确度是指应用程序被正确归类为恶意软件的概率。召回是指所有恶意软件中被归类为恶意软件的那部分。F1分数同时考虑了精确度和回忆,在我们的研究中,精确度和回忆同样重要。因此,可以将F1 score定义为:F1 score =(2 *精度*召回)/(精度+召回)
我们将第1层的神经元数量固定在200个,第2层的神经元数量固定在150个,第4层的神经元数量固定在20个。我们可以发现,当第三层神经元数量设置为50时,分类准确率达到最好。因此,我们将第三层的神经元数量固定为50个。在图8中,我们将第1层的神经元数量固定为200个,第2层的神经元数量固定为150个,第3层的神经元数量固定为50个。
我们可以发现,当第4层神经元数量设置为20时,分类准确率达到最好。因此,我们将第四层的神经元数量固定为20个。根据上述分析,我们将每一层的神经元数量分别设置为200、150、50、20,并与其他结构的分类精度进行比较。从表3可以看出,在这个结构中,我们可以做到最好F1得分,接近95.05%。
(包括3000个来自谷歌Play Store的良性应用和8000个来自Android恶意软件的恶意应用。
并应用SUSI技术对这些数据流特征进行分类。在此基础上,基于DBN深度学习模型实现了恶意软件检测体系结构深度流。我们评估深度流,并对数据流特性进行了深入分析,它利用恶意软件的特征。在此基础上,基于DBN深度学习模型实现了恶意软件检测体系结构深度流。我们评估深度流,并对数据流特性进行了深入分析,它利用恶意软件的特征。实验结果表明,深度流算法的性能显著优于传统的机器学习方法,在合适的参数下可以获得较高的F1分。
DeepFlow: Deep Learning-Based Malware Detection by Mining Android Application for Abnormal Usage 2相关推荐
- DeepFlow: Deep Learning-Based Malware Detection by Mining Android Application
题目: DeepFlow: Deep Learning-Based Malware Detection by Mining Android Application for Abnormal Usage ...
- 【Paper】Deep Learning for Anomaly Detection:A survey
论文原文:PDF 论文年份:2019 论文被引:253(2020/10/05) 922(2022/03/26) 文章目录 ABSTRACT 1 Introduction 2 What are anom ...
- 跌倒综述 Deep Learning Based Systems Developed for Fall Detection A Review
文章目录 1.基本信息 2. 第一节 介绍 3. 第二节 跌倒检测系统文献 4.第三节 讨论和未来方向 5. 第四节 结论 6. 参考文献 1.基本信息 题目:Deep Learning Based ...
- Deep learning based multi-scale channel compression feature surface defect detection system
基于深度学习的多尺度通道压缩特征表面缺陷检测系统 Deep learning based multi-scale channel compression feature surface defect ...
- 基于深度强化学习的车道线检测和定位(Deep reinforcement learning based lane detection and localization) 论文解读+代码复现
之前读过这篇论文,导师说要复现,这里记录一下.废话不多说,再重读一下论文. 注:非一字一句翻译.个人理解,一定偏颇. 基于深度强化学习的车道检测和定位 官方源码下载:https://github.co ...
- (ch9) Deep Learning for Anomaly Detection: A Survey
Deep Learning for Anomaly Detection: A Survey https://www.researchgate.net/publication/330357393_Dee ...
- Turbo Autoencoder: Deep learning based channel code for point-to-point communication channels
Turbo Autoencoder: Deep learning based channel code for point-to-point communication channels Abstra ...
- 【RS-Attack】Data Poisoning Attacks to Deep Learning Based Recommender Systems NDSS‘21
Data Poisoning Attacks to Deep Learning Based Recommender Systems NDSS'21 首个在基于深度学习的推荐系统中进行投毒攻击的研究.文 ...
- Deep Learning Based Registration文章阅读(五)《Anatomy-guided Multimodal Registration by Learning Segment 》
Deep Learning Based Registration文章阅读(五) 这篇文章是MIA2021新出的一篇文章<Anatomy-guided Multimodal Registratio ...
最新文章
- 测试机型不够?把玩家反馈过的问题机型,都测个遍
- python venv windows7_安装 Python、pip 和 venv
- CSS3.0_选择器_学习笔记
- 前端如何进行日志驱动开发
- python 编辑excel需要什么包_Python 中操作EXCEL表格的包
- no typehandler found for property XXXX 解决
- 【itext学习之路】--6.将html转成pdf(解决中文不显示)
- oracle not aviable,ORA-01034: ORACLE not available
- unity3d所要知道的基础知识体系大纲,可以对照着学习
- eps格式图像空白边缘裁剪
- Jogging Trails 邮递员问题
- java11的下载与安装及环境配置
- vue中Axios的封装和API接口的管理
- w3c标准语言,W3C标准 - W3C中国
- layui中实现动态的cols表头字段
- ES--Kibana相关操作创建索引和Mapping
- 华硕电脑改光驱启动计算机,华硕笔记本怎么在BIOS里设置从光驱开启重装系统...
- 《庄子·外篇·天运第十四》
- Java打印实心菱形与空心菱形
- Wannafly挑战赛27 C 蓝魔法师(树上dp)