2.9 IDS08-J净化传递给正则表达式的非受信数据

正则表达式在匹配文本字符串时被广泛使用。比如,在POSIX中,grep命令就支持正则表达式,使用它可以在指定文本中搜索模式。如果要了解正则表达式的基本情况,请参考Java教程[Tutorials 08]。java.util.regex包提供了Pattern?类,这个类封装了一个编译过的正则表达式和一个Matcher类,通过Matcher类这个引擎,可以使用Pattern?在CharSequence中进行匹配操作。
在Java中,必须注意不能误用强大的正则表达式功能。攻击者也许会通过提供一个恶意输入对初始的正则表达式进行修改,比如使其不符合程序规定的正则表达的要求。这种攻击方式称为正则注入(regex injection),它可以影响程序控制流、导致信息泄露,并引起拒绝服务漏洞。
以下这些是在使用正则表达式时,容易被利用的地方。
匹配标志:非受信的输入可能覆盖匹配选项,然后可能会也可能不会传给Pattern.compile()方法。
贪婪:一个非受信的输入可能试图注入一个正则表达式,通过它来改变初始的那个正则表达式,从而匹配尽可能多的字符串,从而暴露敏感信息。
分组:程序员会用括号包括一部分的正则表达式以完成一组动作中某些共同的部分。攻击者可能通过提供非受信的输入来改变这种分组。
非受信的输入应该在使用前净化,从而防止发生正则表达式注入。当用户必须指定正则表达式作为输入时,必须注意需要保证初始的正则表达式没有被无限制修改。在用户输入字符串提交给正则解析之前,进行白名单字符处理(比如字母和数字)是一个很好的输入净化策略。开发人员必须仅仅提供最有限的正则表达式功能给用户,从而减少被误用的可能。
正则表达式注入示例
假设一个系统日志文件包含一系列系统过程的输出信息。其中一些过程会产生公开的信息,而另一些会产生被标识为“private”的敏感信息。以下是这个日志文件的例子:

10:47:03 private[423] Successful logout name: usr1 ssn: 111223333
10:47:04 public[48964] Failed to resolve network service
10:47:04 public[1](public.message[49367]) Exited with exit code: 255
10:47:43 private[423] Successful login name: usr2 ssn: 444556666
10:48:08 public[48964] Backup failed with error: 19

用户希望搜索日志文件以寻找感兴趣的信息,然而又必须防止读取私有数据。程序可能会采用以下的方式,它允许用户将搜索文本作为下面所示正则表达式的一部分:

(.*? +public\[\d+\] +.*<SEARCHTEXT>.*)

然而,攻击者可以用任何字符串替代,这样他就可以通过下面的文本实现正则表达式注入:

.*)|(.*

注入后的正则表达式为:

(.*? +public\[\d+\] +.*.*)|(.*.*)

这个正则表达式会匹配日志文件中的所有信息,包括那些私有的信息。

2.9.1 不符合规则的代码示例

这个不符合规则的代码示例将日志文件周期性地载入内存,它通过将关键词作为参数传给suggestSearches()方法来获得关键词搜索建议。

public class Keywords {
??private static ScheduledExecutorService scheduler
?????= Executors.newSingleThreadScheduledExecutor();
??private static CharBuffer log;
??private static final Object lock = new Object();??// Map log file into memory, and periodically reload
??static
????try {
??????FileChannel channel = new FileInputStream(
?????????"path").getChannel();??????// Get the file’s size and map it into memory
??????int size = (int) channel.size();
??????final MappedByteBuffer mappedBuffer = channel.map(
?????????FileChannel.MapMode.READ_ONLY, 0, size);??????Charset charset = Charset.forName("ISO-8859-15");
??????final CharsetDecoder decoder = charset.newDecoder();?????log = decoder.decode(mappedBuffer); // Read file into char buffer
??????Runnable periodicLogRead = new Runnable() {
????????@Override public void run() {
??????????synchronized(lock) {?
????????????try {
??????????????log = decoder.decode(mappedBuffer);
????????????} catch (CharacterCodingException e) {
??????????????// Forward to handler?
????????????}?
??????????}
????????}
??????};
??????scheduler.scheduleAtFixedRate(periodicLogRead,
????????????????????????????????????0, 5, TimeUnit.SECONDS);
????} catch (Throwable t) {
??????// Forward to handler
????}
??}??public static Set<String> suggestSearches(String search) {
????synchronized(lock) {
??????Set<String> searches = new HashSet<String>();??????// Construct regex dynamically from user string
??????String regex = "(.*? +public\\[\\d+\\] +.*" + search + ".*)";
??
??????Pattern keywordPattern = Pattern.compile(regex);
??????Matcher logMatcher = keywordPattern.matcher(log);
??????while (logMatcher.find()) {
????????String found = logMatcher.group(1);
????????searches.add(found);
??????}
??????return searches;
????}??
??}}

这段代码允许受信用户在公共日志信息中搜索“error”关键词。然而,这样会导致前面提到的通过正则注入进行的恶意攻击。

2.9.2 符合规则的方案(白名单方法)

这个符合规则的方案过滤搜索字符串中的非字母数字的字符(除了空格和单引号外),这种方案可以阻止前面介绍的正则表达式注入。

public class Keywords {
??// ...
??public static Set<String> suggestSearches(String search) {
????synchronized(lock) {
??????Set<String> searches = new HashSet<String>();??????StringBuilder sb = new StringBuilder(search.length());
??????for (int i = 0; i < search.length(); ++i) {
????????char ch = search.charAt(i);
????????if (Character.isLetterOrDigit(ch) ||
????????????ch == ' ' ||
????????????ch == '\ ") {
??????????sb.append(ch);
????????}
??????}
??????search = sb.toString();??????// Construct regex dynamically from user string
??????String regex = "(.*? +public\\[\\d+\\] +.*" + search + ".*)";
??????// ...
????}
??}
}

这个方案同样对有效的搜索项进行限制。例如,用户不再可以使用类似“name=”这样的搜索,因为=字符会被净化掉。

2.9.3 符合规则的方案

另一个减少这种漏洞的方法是,在匹配前过滤敏感信息。这样的方案要求每一次日志文件定期更新时都要进行过滤,从而会产生额外的复杂性和性能损失。如果日志格式变化了,但类的设计没有反映这些变化,那么敏感数据依然可能被暴露。

2.9.4 风险评估

在正则表达式中,没有对非受信的数据进行净化,会导致敏感信息的泄露。

2.9.5 相关规范

2.9.6 参考书目

《Java安全编码标准》一2.9 IDS08-J净化传递给正则表达式的非受信数据相关推荐

  1. 《Java安全编码标准》一导读

    前 言 在Java编程语言中,关键的安全编码要素是采用良好的文档和强制的编码规范.本书提供了在Java语言中的一系列安全编码规则.这些规则的目标是消除不安全的编码实践,因为这些不安全的因素会导致可利用 ...

  2. 《Java安全编码标准》迷你书

    <Java安全编码标准>迷你书 本书不仅从语言角度系统而详 细地阐述Java安全编码的要素.标准.规范和最佳实践,而且从架构设计的角度分析了Java API存在的设计缺陷和可能存 在的安全 ...

  3. 《Java安全编码标准》一2.11 IDS10-J不要拆分两种数据结构中的字符串

    2.11 IDS10-J不要拆分两种数据结构中的字符串 在历史遗留系统中,常常假设字符串中的每一个字符使用8位(一个字节,Java中的byte).而Java语言使用16位表示一个字符(Java中的Ch ...

  4. Java安全编码之用户输入

    0x00 安全引言 1.传统Web应用与新兴移动应用 (1)传统Web应用:浏览器 HTTP 服务器 (2)新兴移动应用:APP HTTP 服务器 从安全角度看,传统Web应用与新兴移动应用没有本质区 ...

  5. 华为java安全编码规范_Java安全编码之SQL注入

    随着互联网的发展,Java语言在金融服务业.电子商务.大数据技术等方面的应用极其广泛.Java安全编码规范早已成为SDL中不可或缺的一部分.本文以Java项目广泛采用的两个框架Hibernate和My ...

  6. Java字符编码根本原理

    2019独角兽企业重金招聘Python工程师标准>>> Java开发中,常常会遇到乱码的问题,一旦遇到这种问题,常常就很扯蛋,每个人都不愿意承认是自己的代码有问题.其实编码问题并没有 ...

  7. Java语言编码规范

    目录1 介绍 1.1 为什么要有编码规范 1.2 版权声明 2 文件名 2.1 文件后缀 2.2 常用文件名 3 文件组织 3.1 Java源文件 3.1.1 开头注释 3.1.2 包和引入语句 3. ...

  8. java length()函数_小猿圈介绍java函数式编码结构及优势

    对于java大家都已经不陌生了吧,今天小猿圈Java讲师就分享一篇关于java函数式编码结构及优势的知识点,希望对于学习java的你有一定的帮助,想学习就需要积累. 探讨三种下一代JVM语言:Groo ...

  9. linux java字符集编码_Java字符集编码

    1.  概述 在 下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 65 ...

  10. 【JAVA编码专题】 JAVA字符编码系列三:Java应用中的编码问题

    这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考. 为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种问 ...

最新文章

  1. MATLAB的左除\和右除/ ??? 自己没有完全明白
  2. asp.net代码中修改web.config节点
  3. 讲几种Python包的安装方式
  4. python怎么打开程序管理器_Python 进程管理工具 Supervisor 使用教程
  5. 让窗体接受拖放, 并获取拖过来的文件信息 - 回复 海浪问 的问题
  6. poj 1386 Play on Words(有向图欧拉回路)
  7. HTML+CSS+JS实现 ❤️经典霓虹灯英文字母特效❤️
  8. [转]Effective C# 原则7: 选择恒定的原子值类型数据
  9. JAVA开发面试常问问题总结4
  10. 在xcode6.1和ios10.10.1环境下实现app发布
  11. 显示隐藏-overflow(HTML、CSS)
  12. the database profile could not loaded. Check log for details
  13. UserWarning: h5py is running against HDF5 1.10.5 when it was built against 1.10.4
  14. 1.《Spring学习笔记-MVC》系列文章,讲解返回json数据的文章共有3篇,分别为:...
  15. 电子计算机为什么123安不出来,方正软件常见问题及其解决办法-精.doc
  16. 小程序之仿小米商城Lite
  17. IE浏览器代理出问题导致的程序网络不可用
  18. cannot find implementation for com.xx.xx.xxDatabase. XXDatabase_Impl does not exist
  19. 外文翻译之 Removing Camera Shake from a Single Photograph
  20. lanswich交换机VLAN配置

热门文章

  1. SQL数据库基础(六)
  2. #大数加减乘除#校赛D题solve
  3. 【算法】如何将一个文件分割成多份(C,Java语言实现)
  4. struts2 跳转类型 result type=chain、dispatcher、redirect(redirect-action)
  5. Nvelocity 第二章 注释语法
  6. -webkit-filter
  7. K3CLOUD表关联
  8. BPT(Business Process Testing)
  9. 【BZOJ】【2768】【JLOI2010】冠军调查
  10. 读懂hadoop、hbase、hive、spark分布式系统架构