声明:为了更好地向读者输出更优质的内容,InfoQ将精选来自国内外的优秀文章,经过整理审校后,发布到网站。本篇文章作者为乌云白帽子blast,原文链接。本文是《IE安全系列》第四篇,已由乌云网授权InfoQ中文站转载。欢迎转发,但请保留原作者信息!

\\


作者 blast

\\

正文

\\

接着上一篇的来,本文多为JavaScript的脚本阅读和解释,阅读都是自行完成,所以不免可能会出现一些错误或者联想过度的情况,如果你发现了哪儿有问题请重重地拍出来。

\\

1、HTML与网马攻击4 — Virus In the Wild

\\

本篇中我们将从真实的Exploit Kit的利用代码入手介绍分析方式,文中例子采用Angler Exploit Kit和Magnitude Exploit Kit(下简称为AEK和MEK)在2015年4月初最新的代码。

\\

AEK和MEK是互联网上最著名的漏洞利用工具包,在Phoenix Exploit Kit作者锒铛入狱之后,这两个Exploit Kit的“市场份额”一下子窜到了前面,因为作者更新快,采用加密方式繁多,导致杀毒软件更新特征也较为困难,这让它们有充足的机会去攻击有漏洞的电脑。本文将介绍这两个Exploit Kit的加密方式和解密方法。

\\

首先,让我们从AEK开始,AEK和MEK都需要有一个Landing Page,用于将用户定向到恶意页面上,打开Landing Page,我们会发现AEK为了做混淆,给Landing Page加了很多无用的垃圾数据,并将加密后的数据混淆插入在这些代码中:

\\\

(点击放大图像)

\

049be994ea114b0a60d432a9b68f4b95.png

\

图:code部分是加密后的代码

\\

将页面向下拖动,快到最后的地方就是它的解密脚本了:

\\

97a2f8d81ee01f7849bbed581b32bbf3.png

\\

图:AEK的脚本

\\

是的,这就是一个高度混淆后的脚本,因为JavaScript代码(或者说类C语言语法)的宽松性,作者在这里面使用了大量的空白、回车、缩进符,同时还替换了变量名,使用大量的数学函数来做混淆。

\\

对于人来说,要阅读这样的代码简直是一个非常恶心的工作,所以在此推荐使用一些代码规范化工具,例如Malzilla提供的JS标准化,或者这里还有一个小技巧:使用Notepad++或者类似工具的括号匹配功能:

\\

0625a04a5b32fb6d8679c47d6e90a575.gif

\\

将光标移动到function的大括号处,此类软件会自动标示出函数范围,可见上图中该函数范围是LN268-LN385。这样,我们就能清晰的知道这个代码的结构了:

\\

7439f3c2011364092a12b105659d1d2c.png

\\

而之前我们也说过,Function除外的Global代码,会从上往下执行,因此,攻击者如果想要实现读取-解密-执行的步骤,执行必然是最后一步,因此我们只需要在它执行之前将要执行的数据找到即可。

\\

e04ec2a6b43ca49bec4b42cecaec274b.png

\\

翻到最后,可以发现LN568-574的Script段其实和上面LN558-565几乎一样。这意味着这段代码很可能包含着解密和执行两步的内容。

\\

从最后一句入手,

\\

LN564:

\\

\rqNNhndhLxLVVb[nmfAbWwoA]('TQgaaGLDVYlaQT',QXuSacI)\

\\

逐个查看变量的作用,

\\

LN267表明:

\\

\rqNNhndhLxLVVb = window;\

\\

这是因为JavaScript中允许将任何对象赋值给某个变量,因此rqNNhndhLxLVVb此时实际上可以看作是window的“别名”或者“同义词”。

\\

看看第二个变量nmfAbWwoA的来源:

\\

LN561可以发现是该变量的第一次使用的地方:

\\

\nmfAbWwoA = \"ezVI\"+\"Migbc\".substr(6,8)  //ezVI\\nmfAbWwoA = nmfAbWwoA+[].join(dLpy) + \"xlyG\"\

\\

变量dLpy经过阅读可知在:

\\

LN437处赋值:

\\

\dLpy=  ('EoVzQHTfRyGU').substr(12,12)  //””\

\\

因此nmfAbWwoA的值实际上只是“ezVIxlyG”。

\\

第三个变量: LN558可以发现是该变量第一次赋值的地方:

\\

\var QXuSacI; \QXuSacI= ['Y', 'r', 'a', 'd', 'P'].join(dLpy)\

\\

由于dLpy我们已经知道是空字符了,所以实际上QXuSacI的值就是”Yradp”。

\\

这样,将三处组合,LN564的原始语句实际上是:

\\

\window[”ezVIxlyG”]('TQgaaGLDVYlaQT', ‘Yradp’);\

\\

这个ezVIxlyG的原型是什么呢?搜索代码,找到它的赋值点:

\\

LN438:

\\

\var D1Kx; \ezVIxlyG= !!D1Kx?true:( function (){ ……} );\

\\

这里有一个约定俗成的内容,可以看到D1Kx是刚刚定义而且未赋值的,将其作为布尔型来处理时,其默认值是false,因此,!!D1Kx的值实际也是false。

\\

这样该三目表达式实际上只是相当于一个普通的赋值:

\\

\ezVIxlyG = function(){……}\

\\

由于此时我们还没处理该函数,因此这个混淆后的代码应该是十分难读的,所以,我们对其进行一个简单的处理: 复制LN439-545

\\

  • \\t

    替换所有双空格、三空格-\u0026gt;单空格,直到没有2个以上连续空格为止。

    \\t\\t

  • \\t

    \、\\r全部删除

    \\t\\t

  • \\t

    使用工具将代码重新格式化。

    \\t\

完成后,代码如下所示:

\\

(点击放大图像)

\

bc3b9a7183cc4e5ada9dd90bc2b4221d.png

\\

可见代码还是难以理解,这是因为其中包含了大量的变量:

\\

f9eb82ae717ae46ce5d9ffdc58a87885.png

\\

你可以看到这个地方定义的变量大部分都会分散地被之后的代码使用到。

\\

所以我们要关注的还是函数的最后:

\\

\if(flag == 1)\{\    rqNNhndhLxLVVb [YPub] ( UjcS )\}\else\{\    rqNNhndhLxLVVb [YPub] ( UjcS )\}\

\\

这里又是一个无用分支,rqNNhndhLxLVVb我们已经知道是window对象了,YPub是什么呢,可以看看上面的代码,最好倒着看,我的注也是从5开始倒着写到1处的,请注意:

\\

\YPub=tP+yMwnso  (注:eval)\tP= 'e' 、 yMwnso= ('Rv'+('uapt') ['re'+'place'] ( 'u', dLpy)) [iCQl0] ( K1DMU, 2 ) +'l'   (注:val)\iCQl0= (wRxKW+'snubnstrn') [F9k2c] ( /n/g , qm3sXy)     (注:substr)\F9k2c=qm3sXy+'r'+ yMwnso + 'pl' + qm3sXy    + 'ac' +yMwnso   (注:replace)\K1DMU=3-2\

\\

因此我们看到了这句实际上是:

\\

\window[”eval”](UjcS);\

\\

现在知道做什么了吗?对,先把eval换成alert!

\\

b80217b5741ba56e5f289a3d8ae352c8.png

\\

然后,直接运行该HTML,得到解密后数据:

\\

(点击放大图像)

\

0dcdf840aeca37a47624f0ca688fc98f.png

\\

baac4b120d1e3bb6fbda89f15bdca550.png

\\

等等,共4次,将这些内容合起来就是解密后的代码了。可以看到这个代码利用了多个新漏洞,甚至包括卡巴斯基控件的安全漏洞。

\\

2、HTML与网马攻击5 - Virus In The Wild

\\

让我们再看看Magnitude Exploit Kit这款EK的代码,相比AEK而言,难度是高还是低。

\\

(点击放大图像)

\

777c153e46549c6921e873eef3d1221f.png

\\

图:MEK的Landing Page

\\

可以看出来,相比而言它的代码貌似要简单得多,可以清晰的看到document和eval被分别赋予了两个不同的变量。

\\

通过将eval修改为alert,执行后得到:

\\

2bdd695337035f661d6d2cae462217e6.png

\\

完了?显然没有,将eval换成alert之后得到的数据是一个function,而点击确定之后,得到了一个脚本错误:

\\

87b795ebee10a4709fabdd1572030ed0.png

\\

图:脚本错误

\\

仔细阅读一下,首先,这个eval的范围是:

\\

(点击放大图像)

\

fadba9a98579eb00eb03ece46327a64c.png

\\

在它之后出现了一个从未见到过的函数:

\\

(点击放大图像)

\

e3a80e25a691844c1d7ec77ee800e230.png

\\

而对比我们之前弹出的alert可以发现,这个函数就是eval解出来的结果,因此,我们应该做的是把eval部分换成解密后的内容:

\\

\function t1g6(a,b){var inn = \document.getElementById('avp6').innerText;var out='';var \c=inn.split('*');for(var k=a;k\u0026lt;b;k++) out += \String.fromCharCode(c[k]-21);return out;}\

\\

用上述内容替换掉eval块,得到:

\\

(点击放大图像)

\

4a3208b6ee3e9e04b5973194eaa00b8c.png

\\

但是之后显然没有eval了,这时,其实我们只需要了解document[”XXX”]将返回document下的XXX对象,这个对象是可以作为函数来调用的(或者不如说函数就是一个对象:) )就可以了:

\\

(点击放大图像)

\

56e3976f6610e66188f6aa9221c17391.png

\\

因此后面的c1h82by0(document)就显得很是危险,所以让我们看看s4tb[0]的内容并注释掉后面的内容,记得之前说的嘛?一个script块中的代码一直到出错为止都是可以正常运行的,所以不用管之后的代码会不会出错了,主要是后面的代码很可能是恶意代码,不能让恶意代码在我们自己的电脑上跑起来。

\\

e206cdeb905e441bcf5f1f95900ab8b2.png

\\

图:执行结果

\\

因此,可以知道这里是在做document[“createElement”]这个操作,司马昭之心,路人皆知,再将其内容改为alert(s4tb1),执行可得:

\\

f250202ad4e57727c5210464c6a7064e.png

\\

图:执行结果

\\

串上后面的内容可以知道,这段代码事实上正在创建一个iframe,其src执行漏洞代码页面: hXXp://bf29df.e66.83.1c.3d8a.54.1393d.bc7dc6b.6.scg512374t1.changesmoves.in/47b1d0b4466375c9306821f48abcd6b5(放心,此时这个网站已经无法访问了。)

\\

至此,这个页面的核心内容我们已经全部了解了,至于后面的几个变量,解法也是一样的,如果想要练手的话,可以试着将页面内容全部还原成无混淆状态试试看。页面内容见附件(密码drops.wooyun.org )。

\\

3、HTML与网马攻击6-利用arguments.callee实现“递归解密”的网马以及解密

\\

希腊神话中有一条名为Ouroboros的蛇,它咬着自己的尾巴,它的姿态象征着“不死”、“完全、“无限”、“世界”、“睿智”等种种意味。

\\

e9fa8371466a7884d007ce13034415d6.png

\\

图:乌洛波洛斯,网络图

\\

在编程中,称作递归,递归在JavaScript中可以像C的代码一样来调用:

\\

\function a(){ a();}\

\\

不仅如此,JavaScript还支持一种arguments.callee的方式来调用。callee为对当前函数的引用,故可以作为类似递归的方式来调用自身。

\\

不过,递归还是需要谨慎的,稍有不慎,一个bug即可导致整个程序出现不可知的情况。

\\

ad3c4c9ec24efc9b3c8b3b428730b6ca.png

\\

图:IE10递归导致死循环,栈空间全部用完导致崩溃

\\

言归正传,先让我们看两个例子大致理解一下普通递归和arguments.callee:

\\

以下两个例子输出均为:1 2 3。

\\

普通递归,

\\

\function mylog(current, max)\{\if(current \u0026lt;= max) \{\console.log(current); \add(current+1, max);\}\} \\mylog(1,3);\

\\

以及arguments.callee:

\\

function f(x)
\{
\console.log(x);
\return arguments.callee;
\}\u2028
\f(1)(2)(3);

\\

从实际入手吧,请参考如下网马的例子:

\\

(点击放大图像)

\

02193b4bcb70175d8d4c1f31ffd35a9e.png

\\

是否第一眼就看到了倒数第二行出现了

\\

\

eval(I3qVh4gPT);

\

\\

如果你试图将它改为alert(I3qVh4gPT);,那么这个函数的解密结果必然会失败:

\\

(点击放大图像)

\

8fb94b115993c1f4e168ae9fcfe1be8a.png

\\

原因是什么呢?请看第一行出现了。

\\

\v ar\eJmF3VT3H=arguments.callee.toString().replace(/\\W/g,'').toUpperCase();\

\\

我们知道arguments.callee是对当前函数的引用,那么这个引用转为字符串是什么呢?让我们测试一下:

\\

eb2203216105fa859be2f4baaf4af43e.png

\\

原来就是返回了当前函数。

\\

fbb1d5a5b8123c9c9bd865b574fecbbd.png

\\

仔细一看,这里会把函数自己当成参数来解密。

\\

所以,如果我们想要解开这个脚本的加密应该怎么弄呢?

\\

A、简单阅读代码

\\

从最后来,

\\

①eval(I3qVh4gPT);引用了变量I3qVh4gPT。

\\

②I3qVh4gPT+=String.fromCharCode(EHxDfdAM5);引用了变量EHxDfdAM5。

\\

③EHxDfdAM5=e3FP5e1M6-IA17ef3d3[bqjtxUvBR];if(EHxDfdAM5\u0026lt;0) {EHxDfdAM5=EHxDfdAM5+256;} 引用了变量e3FP5e1M6、IA17ef3d3[0]。

\\

④e3FP5e1M6=parseInt(EWX1TnOBq,16); 引用了变量 EWX1TnOBq,将其作为十六进制解析。

\\

⑤var EWX1TnOBq=mXSYkqH0X.substr(PwgNCEKQL,2); 中,mXSYkqH0X是参数,PwgNCEKQL是计数器。

\\

⑥for(PwgNCEKQL=0;PwgNCEKQL

\\

⑦Oq32NWn5D=mXSYkqH0X.length; ,也即参数的长度,因此,这段代码在解密传入的参数。

\\

还有,③中出现了另一个变量IA17ef3d3,这个变量出现在⑧IA17ef3d3[PwgNCEKQL]=fgMN0vK2r.charCodeAt(va31p5um0);,这之中还引用了fgMN0vK2r、va31p5um0两个变量

\\

⑨fgMN0vK2r=RsIkkqdYi[(fgMN0vK2r^eJmF3VT3H.charCodeAt(gMKy026SO))\u0026amp;255]^((fgMN0vK2r\u0026gt;\u0026gt;8)\u0026amp;16777215);中出现了fgMN0vK2r。RsIkkqdYi是一个预设密钥组,eJmF3VT3H是当前函数(arguments.callee.toString()等处理后的结果),gMKy026SO是计数器。因此这句是在基于一个密钥组产生一个密钥组;

\\

⑩for(PwgNCEKQL=0;PwgNCEKQL\u0026lt;8;PwgNCEKQL++) {var va31p5um0=Oq32NWn5D+PwgNCEKQL;xy3D07u0l[PwgNCEKQL]=1;xy3D07u0l[PwgNCEKQL]=FSB4JaYie;if (va31p5um0\u0026gt;=8) {va31p5um0=va31p5um0-8;IA17ef3d3[PwgNCEKQL]=fgMN0vK2r.charCodeAt(va31p5um0);} 同样,va31p5um0也在参与解密。

\\

也即,将传入参数每隔2个字符作为一个HEX,然后解出来,与将函数自身的字符串通过解密算法解出来的数据相减,两者结果小于0的话,加上256,最终对所有字符都如此操作,将结果连接起来得到解密数据。

\\

既然函数本身不能轻易修改,那么只好从最终的eval做突破了,JavaScript中允许“劫持”一个对象。即和操作普通变量的赋值一样,函数也是可以通过赋值来覆盖的,请看第二部分。

\\

B、函数劫持

\\

(点击放大图像)

\

538cad28d8dfa3a293db24c9e091367a.png

\\

针对这个代码,因为最终它会通过eval来运行恶意代码,所以添加eval=alert,在运行到eval之前将其劫持即可。

\\

运行代码可以得到:

\\

(点击放大图像)

\

a8fd75d4663ec890ba616d2699498472.png

\\

最后,总结一下,在Jscript9.dll中,脚本的函数中调用arguments.callee.toString()时,大致经历了如下几个步骤:

\\

  • 解析脚本文字(ScriptSite::ParseScriptText);\\t
  • 送与解析内核,生成字节码,通过字节码解释器(即Intepreter)来执行;\\t
  • 在处理到arguments.callee.toString()时,jscript会将函数自身marshal成BSTR,然后转换成JsVar,传递给后续要使用它的代码。\

题外话,这个代码其实是2010年发现的一个广告软件(是当时流行的Rogue antivirus,也就是伪装成杀毒软件的广告程序)安装页的Landing Page,当时我还特地上论坛和大家讨论了怎么解决,大家给出的思路也相当多,除了上述我说的方法之外,一些自动化解密工具也可以处理此类网马,例如Malzilla。不过建议大家不要过于依赖工具,而是把工具当作可以简化重复劳动的工具是最好。

\\

到此为止,脚本先锋系列的解密部分就告一段落了,下一篇开始,将简单的介绍调试器的用法以及如何对网马中使用的Shellcode进行调试,其中也包括简单的对恶意SWF、PDF的分析的内容。

\\

参考资料

\\

  1. 文中恶意脚本打包下载,请在虚拟环境下测试与调试(密码drops.wooyun.org )\

感谢魏星对本文的策划和审校。

\\

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号:InfoQChina)关注我们,并与我们的编辑和其他读者朋友交流(欢迎加入InfoQ读者交流群06e1fec4a87eca3142d54d09844c629f.png)。

IE安全系列:脚本先锋(2)相关推荐

  1. IE安全系列:脚本先锋(4)

    脚本先锋系列第四章,也是最后一章.将介绍对Shellcode的调试,以及SWF.PDF漏洞的利用文件的简单处理过程. \\ 下一部分预告: \\ IE安全系列:中流砥柱(I) - JScript 5 ...

  2. IE安全系列:脚本先锋(II)

    blast · 2015/05/04 9:59 接着上一篇的来,本文多为Javascript的脚本阅读和解释,阅读都是自行完成,所以不免可能会出现一些错误或者联想过度的情况,如果你发现了哪儿有问题请重 ...

  3. IE安全系列:脚本先锋(I)

    回顾一下,前两篇概述了一下IE的以下内容:IE的历史,各个版本新增的功能.简单的HTML渲染逻辑和网站挂马对IE安全带来的挑战. 从这章开始,将继续以网马为契机,逐渐深入讲述IE的漏洞分析与安全对抗的 ...

  4. IE安全系列:脚本先锋(1)

    声明:为了更好地向读者输出更优质的内容,InfoQ将精选来自国内外的优秀文章,经过整理审校后,发布到网站.本篇文章作者为乌云白帽子blast,原文链接.本文是<IE安全系列>第三篇,已由乌 ...

  5. Python系列脚本

    今天看了点log,发现累的慌,写了个脚本解析一下过滤出来 import string f=file('20160923_160206_F5AZCY04F095_logcat.txt') w  = op ...

  6. 传奇身上装备升级系列脚本,以及UPGRADEITEMEX 脚本的详细参数解释

    UPGRADEITEMEX 脚本的详细参数解释如下: UPGRADEITEMEX 物品位置(0-12) 属性位置(0-14) 成功机率(0-100) 点数机率(0-255) 是否破碎(0,1) 物品位 ...

  7. 青龙羊毛——关于脚本

    关于脚本 该系列脚本大部分搬运自竹大和soy大佬,从头到尾本人从未修改过任何脚本内容,脚本仓库地址也是大佬的原仓库地址,从未上传个人仓库,当然如果有大佬删库的,可能会备份一下,防止后面拉库的人拉不到脚 ...

  8. 使用COE脚本绑定SQL Profile

    日常运维中,经常会遇到需要绑定好的执行计划的场景. 简单来说,就是将一个sql_id绑定好的plan_hash_value.如果没有使用到绑定变量,还需要把force_match设置为true. 用到 ...

  9. oracle冷备修改数据文件位置,Oracle冷备迁移脚本(文件系统)

    Oracle冷备迁移脚本(文件系统) 两个脚本: 网络拷贝到目标服务器的脚本cpdb16.sh 1. 配置文件生成脚本 #!/bin/bash #Usage: create db.config fil ...

最新文章

  1. 无人驾驶汽车系统入门:基于深度学习的实时激光雷达点云目标检测及ROS实现...
  2. 【转】Python开发指南:最佳实践精选
  3. 关于国内部分电子病历编辑器的评价
  4. Java中常用的测试工具JUnit
  5. 一款世界上最快的固态硬盘
  6. FastReport 数据区二级显示
  7. 无向带权图的存储结构_每天5分钟用C#学习数据结构(27)图 Part 8
  8. Android面试心得,已拿到字节跳动,京东,android应用开发基础学堂在线答案
  9. 微软服务器如何启动tomcat,Windows服务器下重启Tomcat服务步骤
  10. win10安装出现“Windows以保护你的电脑” Micosoft Defender SmartScreen阻止了无法识别的应用启动。运行此应用可能会导致你的电脑存在风险。
  11. 北信源桌面终端管理系统部署与问题
  12. Java 拾遗补阙 ----- 继承私有属性
  13. global mapper 导入bln文件和tif文件
  14. 支付宝付款弹窗 被浏览器拦截
  15. JAVA POI删除word里面的批注comment
  16. 英特尔对手机的几个痛苦领悟
  17. 服务器系统才有卷影副本吗,windows server 2019没有适合具有卷影副本的卷
  18. 深度学习的趣味app简单优化(适合新手)
  19. 「ことから」と「ことだから」
  20. 《自己动手写Docker》学习笔记2

热门文章

  1. 伺服生产方案埃斯顿伺服
  2. 粉笔黑板教师节PPT模板
  3. CC00068.pbpositions——|HadoopPB级数仓.V02|——|PB数仓.v02|元数据管理工具Atlas|部署配置|账户密码|
  4. es管理器免root_ES浏览器专业版-ES文件浏览器专业版(ES File Explorer Pro)下载v4.2.3.6 特别版-西西软件下载...
  5. ES文件浏览器 如何提取盒子已安装(内置)软件APK 教程
  6. AMEsim 几个启动错误解决方法
  7. Android LinearLayout横排和竖排布局
  8. 如何使用自动编码器生成图像
  9. 图像处理:JPG、PNG及BMP的区别?
  10. Word控件Spire.Doc 【邮件合并】教程(六): 使用 C# 识别 Word 中的合并字段名称