网络流量分类方法调研

传统的网络流量分类方法

基于端口

最初的标准协议都分配有固定的端口,如HTTP服务的端口号为80,SMTP(简单邮件传输协议)服务的端口号为25等。在解析出数据包的端口信息后,可以据此推断网络流量所属协议类型
问题:随着动态端口、伪装端口及不标准端口号的出现,该方法的识别准确率显著下降。

基于有效负载

基于有效负载的方法,如深度包检测,通过在IP包的有效负载中搜索应用程序的签名,能够在一定程度上避免动态端口问题。
问题:
-当加密流量出现时,该方法很难实现且计算开销很高
-面对快速发展的网络,需要不断地更新和维护协议特征库

基于流量统计

依据流量的一些外部统计特征,如包间时间、总包数、流量持续时间等,多采用机器学习方法实现流量的分类
常用的机器学习算法有:
-机器学习中的经典算法:随机森林、SVM、朴素贝叶斯、C4.5等、各种聚类算法
-深度学习模型:神经网络CNN、RNN等;去噪自编码器
特点:对动态端口和加密流量等具有高适应性,是当前流量分类领域的研究热点。

流量分类框架

监督学习

利用一组已标记的数据样本训练一个流量分类器,将未识别流量划分到所能识别的已知类别中,目前准确率基本可达到98%以上。

无监督学习

通过聚类等无监督学习算法对一组无标记样本自动进行分类,然后在DPI等工具的帮助下为聚类结果打上相应的标签。

该领域可用的公开数据集

  1. WIDE数据集:http://mawi.wide.ad.jp/mawi/
    该数据集进行了脱敏处理,只包含IP包头部分,且没有标注过

  2. CIC数据集:https://www.unb.ca/cic/datasets/
    主要是一些入侵检测、恶意软件的数据集
    其中VPN-nonVPN traffic dataset (ISCXVPN2016)数据集中包含7种加密流量
    本数据集未经过任何处理

上述两个是流量分类领域论文写作的常用数据集

流量数据预处理方法

1.以单条流或单会话流为最小识别单位
-提取每条流的外部统计特征(如包间时间、字节数等)组成特征向量来表示每个流样本
-提取每条流all层或者应用层的前784字节或1024字节,或者提取每条流的前多少包,每个包提取前多少字节,从而将每个样本表示成一个灰度图像(矩阵)

特点:特征信息充足,无论是流统计特征还是负载特征,皆能有效地表示特定的协议类型信息
缺点:提取特征的过程耗时长且复杂,不易于实现
可用的特征处理工具:nDPI、nfstream

2.以单个数据包为最小识别单位
每个数据包取应用层负载部分前30或36个字节组成特征向量来表示一个样本
常用的特征表示方法:n-gram或BoW模型

目前流量分类领域的发展方向

  1. 如何在当前网络环境急速更新交替的环境下,对网络流量进行实时分析,达到精准分类

  2. 提高识别和提取未知应用程序产生的网络流量的准确性和识别效率

  3. 对加密流量的识别分析

网络流量分类方法调研相关推荐

  1. 预测混合模式发展前景计算机,基于混合模式的网络流量分类优化-计算机技术专业论文.docx...

    基于混合模式的网络流量分类优化中文摘要 基于混合模式的网络流量分类优化 中文摘要 网络流量分类是指将混合有各种应用的流量按应用协议来进行分类,即鉴别网络 报文分组的应用类别的过程.网络流量分类技术除了 ...

  2. 基于深度学习的SDN家庭网关加密网络流量分类

    写在前面: 本文翻译供个人研究学习之用,不保证严谨与准确 github链接:https://github.com/WithHades/network_traffic_classification_pa ...

  3. 流量分类方法设计(一)——参考论文整理

    流量分类方法设计(一)--参考论文整理 因为最近在做流量分类有关的工作,所以将整个工作思路整理下来,希望对以后进一步的学习和论文写作有所帮助. 这一篇主要整理一下最近有关流量分类的论文,介绍他们的设计 ...

  4. 基于KMeans聚类算法的网络流量分类预测

    温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目简介 网络流量分类或网络流量异常检测,采用基于聚类的机器学习算法,实现异常检测与分类,即划分为正常流量和异 ...

  5. [转]HTTPS网络流量解密方法探索系列(一)

    前言 分析网络流量总是绕不开HTTPS,因其广泛使用甚至是强制使用逐渐被大众熟知,在保证其安全的同时也提高了对流量进行研究的难度.目前解析HTTPS协议的文章很多,有很多不错的文章可以带着入门,老实说 ...

  6. 配置MRTG监控网络流量简单方法

    MRTG (Multi Router Traffic Grapher)是一款监控网络流量负载的免费软件,目前利用MRTG已经开发出了各式各样的统计系统: 1.系统资源负载统计,例如:磁盘空间.CPU负 ...

  7. linux 进程流量统计,Linux进程网络流量统计方法及实现

    1 前言 在某些应用安全场景须要结合进程级网络链接.流入流出流量等数据直接分析出进程的异常.例如,在内网主机上是否存在持续恶意外传敏感数据的现象.在网络监控时发现服务器大量带宽被占用但不清楚由系统具体 ...

  8. Linux进程网络流量统计方法及实现

    1 前言 在某些应用安全场景需要结合进程级网络连接.流入流出流量等数据直接分析出进程的异常.例如,在内网主机上是否存在持续恶意外传敏感数据的现象.在网络监控时发现服务器大量带宽被占用但不清楚由系统具体 ...

  9. 查看Infinicon的HCA卡上的网络流量的方法

    在应用程序运行中,我们可以通过以下方法查看HCA网卡的端口流量信息,步骤如下,供参考: 1)清除正在使用端口的状态,假定使用端口为port1 #cd /proc/iba/mt23108/1/port1 ...

  10. 【论文分享】不平衡流量分类方法 DeepFE:ResNet+SE+non-local:Let Imbalance Have Nowhere to Hide

    论文:Let Imbalance Have Nowhere to Hide Class-Sensitive Feature Extraction for Imbalanced Traffic Clas ...

最新文章

  1. Eiblog 初体验,搭建教程
  2. java常见排序算法有哪些_Java中常用的6种排序算法详细分解
  3. jwt 私钥_三分钟带你了解JWT认证
  4. 我应该做哪个行业的销售
  5. 单片机一键开关机硬件电路
  6. fms2.0视频服务器系统,[FMS]adobe FMS(flash media server )服务器安装过程
  7. 【TcaplusDB知识库】快速上手TDR表的增删查改操作
  8. 论“无常,苦、无我”
  9. 推荐两款github敏感信息搜集工具(gsil、gshark)
  10. PATA1142 Maximal Clique(测试点2、3)
  11. 住友重机械工业株式会社获得在日本生产和销售基于加速器的BNCT系统和照射剂量计算程序的医疗器械审批许可
  12. 无需公网IP,免费内网穿透【cpolar】访问内网服务
  13. 编程中取名,有什么需要注意?
  14. 学生办理美国旅游签全过程
  15. 凑个热闹,发布一下Consolas和雅黑的混合字体
  16. ThinkPHP5.1批量删除
  17. Plant Simulation使用技巧
  18. Java基础 - 标识符
  19. 虚假新闻识别检测分类
  20. 网易24周年,竟拿出内部进阶必备的网络协议笔记,给程序员发福利

热门文章

  1. android 标准注释方法,android studio 学习笔记之 注释规范化
  2. 第二章 认识的本质及其规律笔记
  3. Pytorch扫盲 - 安装、训练、测试、可视化、网络结构、finetune、loss
  4. 给视频加水印的软件有哪些?推荐两种软件快速加水印
  5. JSP内置对象response常见用法
  6. 电脑端/手机端获取京东pt_key和pt_pin的几种方式
  7. Sql server 双机热备份数据库
  8. VirtualBox的菜单栏被隐藏的解决办法
  9. 解决sublime中文输入问题
  10. 电商运营数据分析常用分析指标--交易数据指标、品类分析数据指标与内容分析数据指标