恶意外链|基于网站html文件查找恶意外链

声明:刚入门Python,第一次发文,分享学习,不足之处请大佬点评。本文内容仅供参考,未经允许不得转载。

0x00 前言

恶意外链存在形式多样,并没有一个具体的界限,查找思路也万千,这里只阐述对于已拿到的网站源文件,如何进行恶意外链提取。
本文以某门户网站为例。该门户网站历史遗留的恶意外链仍然存在。针对这一点,对于整个门户网站进行恶意外链排查。

0x01 思路

其一,通过分析发现,恶意外链对应IP多数位于境外。IP位于境外不一定是恶意外链。
其二,恶意外链存在来源页面,基本上位于html文件内。非html文件也可能存在url。

思路:提取整个网站存在的url及其对应域名,进行域名解析、IP定位,筛选出定位于境外的对应域名和来源页面,对结果进行手动排查。

0x02 如何进行恶意外链提取?

一、需要读取整个网站文件路径。

由于网站文件内包含的不仅仅是.html为后缀的文件,还有大量.gif、.zip、.css等文件,所以这里需要一个文件读取白名单,只读取可能存在url的后缀文件。
后续针对其他网站时,若有发现新的后缀,可以加入。

二、读取文件内容,利用正则匹配出所有的url

基于网站html文件查找恶意外链相关推荐

  1. linux 查找文件夹_用python打造一个基于socket的文件(夹)传输系统

    这段时间在学习python,接触到了网络编程中的socket这块,加上自己在用的Linux服务器都是原生支持python的,于是乎有了个做文件传输功能程序的想法. 毕竟python语言中,有下载功能的 ...

  2. 网站被攻击如何查找木马文件 以及攻击者IP

    很对客户网站以及服务器被攻击,被黑后,留下了很多webshell文件,也叫网站木马文件,客户对自己网站的安全也是很担忧,担心网站后期会继续被攻击篡改,毕竟没有专业的安全技术去负责网站的安全防护工作,通 ...

  3. 基于Web的文件管理系统,支持Office、WPS预览/编辑、在线解压缩、文件分享、文件加密、远程存储、远程文件推送、秒传、断点

    基于Web的文件管理系统,支持权限管理.历史版本管理.Office预览/编辑.WPS预览/编辑.在线解压缩.文件分享.文件加密.远程存储.远程文件推送.秒传.断点续传.智能搜索.文件备注.本地自动备份 ...

  4. Linux基础命令(四)文件查找和压缩、软件安装、源码包管理

    目录 一.查找和压缩 1.文件查找 2.文件打包和压缩 二.软件安装 1.RPM包管理 三.源码包管理 一.查找和压缩 1.文件查找 (1)witch:命令查找 witch ls(命令) #查找ls命 ...

  5. linux查找以h结尾的文件,【linux_笔记】Linux_文件查找(find)详解特殊权限

    学习记录过程中难免出现错误,如有发现,还望大神们指出. 示例操作部分有的与历史操作有关,如果先前的示例操作没有执行过的话,可能会有部分示例的操作无法执行.示例仅供参考(练习题在附录). 文件查找: l ...

  6. 文件查找命令find的使用

    文件查找find命令的使用 文件查找的命令有两个find和locate,但大部分用find的比较多,这两种的区别为ocate:非实时,模糊匹配,查找是根据全系统文件数据库进行的:# updatedb, ...

  7. c++ 查找文件夹下最新创建的文件_Linux文件查找进阶知识,find命令的用法及解读...

    1.上面讲到了使用locate查找文件,它是进行非实时的.模糊查找,基于对某段时间建立的数据库来对文件进行搜索,查找时间相对快速,今天来看看另一个文件查找工具find,它是对文件进行实时查找.精确查找 ...

  8. 文件查找和压缩——Linux基本命令(12)

    1.文件查找 在文件系统上查找符合条件的文件:locate, find 非实时查找(数据库查找):locate 实时查找:find 2.locate (1)功能特点 查询系统上预建的文件索引数据库 / ...

  9. Linux文件查找工具之find “大宝剑”--转载

    原文地址:http://xinzong.blog.51cto.com/10018904/1749465 一.文件查找工具常用软件 locate: locate命令其实是find -name的另一种写法 ...

最新文章

  1. Ext JS Designer 1.0.5 发布
  2. [数据库]Oracle和mysql中的分页总结
  3. Simulink触发子系统使用方法
  4. javase获取项目根目录_JavaSE:如何设置/获取您自己的文件和目录属性
  5. C#中的泛型化方法的实现
  6. 静态组件_静态网站的出色附加组件,可让您跳舞
  7. PHP魔术方法小结.md
  8. git pull拉取远程指定分支
  9. 问题查询-批文页面显示别人操作的结果
  10. 爬取世界各国历年的GDP数据
  11. 使用axure rp8 制作一个iphonex手机框架
  12. Markdown流程图实用工具汇总Obsidian+excalidraw
  13. Myeclipse运行servlet文件页面报错404
  14. Room框架学习、使用
  15. Foundry 中文文档发布啦
  16. PLSQL入门与精通(第72章:LOGOFF触发器)
  17. ff14 掉线 服务器维护,《FF14》29日更新维护 暂不推出手工补丁
  18. 查看手机IMEI IMSI
  19. android 面试题(三)
  20. Eclipse调试python

热门文章

  1. 【PSO三维路径规划】基于matlab粒子群融合遗传算法多无人机三维路径规划【含Matlab源码 333期】
  2. 惠普微型计算机t628电源,HSTNS-PL18 DPS-750RB A 506822-201 750W HP服务器电源
  3. 客快物流大数据项目(四十八):Spark操作Kudu 修改表
  4. java swing substance_java swing皮肤使用(substance)
  5. Service Locator服务定位器
  6. 电脑重装小白系统没内存怎该如何解决
  7. python 网络爬虫开发第五天
  8. 2022高教社杯数学建模思路 - 案例:BIRCH-层次聚类算法
  9. ArcGIS 宗地图批量打印输出
  10. when tired