Hyperscan

深入浅出Hyperscan出版啦!

正则表达式的概念早在20世纪50年代就由美国数学家克莱尼提出。由于其丰富的描述性特征,在大家日常开发和运维中得到了极其广泛的运用。尽管功能强大,基于经典算法实现的正则表达式匹配性能并不高效。在网络安全场景下,正则表达式被广泛用于以规则匹配为核心的深度报文检测。流量特征的多样性决定了需要定义大量正则规则进行匹配,从而成为网络处理中的一大性能瓶颈。在实际生产环境中甚至会导致正则表达式拒绝服务攻击(Regular expression Denial of Service: https://blog.cloudflare.com/details-of-the-cloudflare-outage-on-july-2-2019/)。因此在几十年的发展过程中,对正则表达式匹配的研究层出不穷,沉淀出了许多经典的算法。在CPU上以软件形式运行这些经典算法仍然难以满足网络处理性能的要求。

Hyperscan是一款高性能正则表达式匹配开源软件库。它的设计初衷就是为了实现基于软件的高性能正则表达式解决方案。凭借创新性的系统设计和巧妙的算法实现,Hyperscan的横空出世解决了长期困扰大家的性能痛点。随着时间的推移,Hyperscan已经商用于诸多顶级的网络设备商和云厂商的生产环境,显著解决了性能瓶颈问题。Hyperscan广泛应用于各类网络应用中,包括入侵检测和防御系统(Snort和Suricata)、网络应用防火墙、垃圾邮件过滤系统(Rspamd)、协议/应用识别系统(nDPI)等。它还能够提高数据分析应用的性能,包括日志分析系统、代码版本控制系统(GitHub)和数据库(ClickHouse)等。

Hyperscan作为已经被广泛使用的成熟产品,许多学术界研究者和产品开发者对其内部设计实现产生了十分浓厚的兴趣。相信对大多数人来说,正则表达式匹配算法是一个较为陌生的领域。Hyperscan本身又有许多创新的算法设计并未在公开文献中发表。在没有足够基础和时间的前提下,直接从代码层面去剖析Hyperscan较为晦涩和繁琐。作为Hyperscan的开发者,我们也想通过更好的渠道来分享其中的技术精华,让大家从中汲取一些核心设计思想以应用于实际工作学习中。因此我们花了很多精力撰写了这本新书:深入浅出Hyperscan:高性能正则表达式算法原理与设计

本书由浅入深,从正则表达式基础知识介绍逐步深入Hyperscan内部具体的设计和实现。其中主要包含以下内容:

  • 介绍正则表达式的背景知识以及字符串匹配和正则匹配的各类常规算法;

  • 探索Hyperscan算法库的功能特性和与业界广泛使用的较为成熟的正则匹配算法库的比较;

  • 阐释Hyperscan总体设计原则,并详细描述了对正则表达式的全新解构思路;

  • 展现经过解构后的正则表达式模型的实现方法,并详细描述了优化手段;

  • 介绍Hyperscan使用过程中性能调优的若干原则与技巧;

  • 展示Hyperscan与多种现实应用的整合案例。

欢迎感兴趣的同学多多支持我们的新书!希望你们能从中学习到正则表达式匹配以及Hyperscan的设计精髓,并将其熟练运用在日常学习工作中。

(购买链接请点击文末左下角阅读原文

转载须知

DPDK与SPDK开源社区

公众号文章转载声明

推荐阅读

SPDK Vhost 基于最新21.10发布版本的性能报告

DPDK Release 21.11

基于SPDK 加速框架的高性能PMEM Bdev

SPDK的BPF Tracing

SPDK发布v21.10版本

点左下角“阅读原文”查看购买链接~

深入浅出Hyperscan出版啦!相关推荐

  1. 深入浅出MySQL出版了

    经过近一年的写作,我们的新书,也是大家的第一本书<<深入浅出MySQL>>终于出版了,近期已经在全国上市,下面是图示的封面: 还有程序员杂志做的宣传: 从china-pub前两 ...

  2. Intel 助力移动云百万 IOPS 云硬盘,打造极速云存储体验

    前言概述 物联网.人工智能.5G 等技术带动数据爆发式增长,企业超大规模数据的存储与治理成本与日俱增,且随着数据库.实时日志分析等关键业务上云,企业对存储系统的性能要求也随之提升,存储系统面临着管理海 ...

  3. 利用AI技术释放网络应用创新

    方案一览 利用AI技术释放网络应用创新 结合英特尔® 至强® 可扩展处理器添加的新指令和高性能软件框架,实现了网络工作负载的实时AI能力 方案概要 英特尔在AI领域推动芯片和软件技术的进步,降低了网络 ...

  4. opencvpython教程百度云资源_Python+OpenCV图像处理入门,视频教程下载

    课程介绍: 李老师讲课生动.深入浅出,出版OpenCV编程案例详解.Python-OpenCV图穷录.MATLAB图像处理.MATLAB图像案例教程等在线课程. 本课程系统概括了Python-Open ...

  5. 学以致用深入浅出数字信号处理 pdf_Robei |《数字集成电路设计》正式出版啦

    原标题:Robei |<数字集成电路设计>正式出版啦 1.背景 <数字集成电路设计>作为电子信息.自动化.微电子.计算机.通信.电子工程等学科专业必修的数字电路技术课程 ,自2 ...

  6. 《深入浅出Ext JS》(第2版)即将上市

    <深入浅出Ext JS>(第2版)将于5月初上市.在此非常感谢各位购买和阅读本书第1版的广大读者,感谢大家对本书的关注,及阅读后给予本书的中肯评论.同时感谢,本书改版之前,积极参与图灵组织 ...

  7. 《深入浅出Ext JS》2.19全国首发

    <深入浅出Ext JS>2.19全国首发 <深入浅出Ext JS>自选题立项以来,在JavaEye和博客园等知名技术社区内就已经引起了广泛的关注和强烈的反响.在写作和编辑阶段, ...

  8. 深入浅出SQL Server Replication第一篇:走近Replication(上)

    深入浅出SQL Server Replication第一篇:走近Replication(上) 对于很多的SQL Server DBA而言,Replication不是什么新鲜的事物了,也是大家常常说的& ...

  9. 个人知识管理专著《你的知识需要管理》出版

    在飞速变革的知识经济时代里,个人发展越来越依赖于个人竞争力,而组织的竞争力也更多依赖知识员工的绩效,如何提升知识工作者处理信息和知识的效率与能力成为管理学面临的一项重要挑战. KMC讯,由知名知识管理 ...

最新文章

  1. 『高级篇』docker之APIGateway(17)
  2. 解决git 提交出现这个错误fatal: Unable to create ‘project_path/.git/index.lock‘: File exists.
  3. 爬虫 | urllib入门+糗事百科实战
  4. linux下如何产生core,调试core
  5. mysql的调试与分析_mysql日志管理分析调试实例_MySQL
  6. 如何通过7个Logback调整立即改善Java日志记录
  7. 菜鸟学前端--javascript基础
  8. 蒂法html5游戏,《最终幻想7:重制版》大量新截图:蒂法招式/支线任务
  9. typecho运行html插件,typecho主题集成HTML压缩功能
  10. td外边加div为啥不隐藏_那些不常见,但却非常实用的 css 属性
  11. LAMP笔记之Apache篇(2)
  12. iOS 使用pods报错问题 pod --version
  13. 一种用FFmpeg直接录屏并直播的方法
  14. 搜索命令:whereis/which/locate/find/grep
  15. ODL(C版本)安装过程
  16. OpenCV3.0+VS2015+Win7x64开发环境搭建报错找不到gdi32.lib、opencv_world300d.dll
  17. JAVA 导出大批量数据EXCEL
  18. 深富策略主力资金逆势突袭这个版块
  19. 工控系统的全球安全现状:全球漏洞实例分析
  20. 深度剖析ConcurrentHashMap

热门文章

  1. 5s系统升级无服务器,苹果iPhone5s手机显示无服务现象的解决方法图解
  2. VLOOKUP函数还记得吗?
  3. 好用的图标下载网站推荐
  4. 华为鸿蒙P10plus,华为P10/P10 Plus上手评测:多种配色亮眼 颜值大提升
  5. compareTo() 方法详解
  6. 梯度下降:全梯度下降算法(FG)、随机梯度下降算法(SG)、小批量梯度下降算法(mini-batch)、随机平均梯度下降算法(SAG)。梯度下降法算法比较和进一步优化。
  7. 情境化——让活动页面击中用户
  8. Tomcat配置https(jks证书请求)
  9. JSON的三种解析方式以及JSONObject、JSONArray区别
  10. 读书笔记 量化交易:如何建立自己的算法交易事业