猫宁!!!

参考链接:

https://www.freebuf.com/articles/network/169601.html

https://www.jianshu.com/p/f8062e2cc1d7

百度搜索高级语法很多,但在渗透测试中有效的语法也就10多个,它们通过自由组合,帮我们实现高效搜索目标。

相比语法,语法的应用场景更为关键,exp-db中的google hacking提供了大量的参考场景,给我们提供了多种多样的弹药。

https://www.exploit-db.com/google-hacking-database

能用百度演示,就不用了谷歌了,原因结尾说,不过别误解,和GFW没半毛钱关系。

双引号 "" ,英文双引号,锁定关键词

我试了一下百度,"百度网盘"加引号与不加引号搜索结果区别不大,借助谷歌。

不加引号,你看网页说明出,还有 百度 这个结果标红,搜索结果1.36亿条。

加引号,截图之外的网页说明处也都是标红 百度网盘 这个关键词,更精准,搜索结果3800万条。

加号,让搜索中尽可能出现加号之后的关键词,这个功能在谷歌和百度中都比较鸡肋。星号,英文的小点以及“~”用处同样不明显。搜索引擎高级语法本身也是区分可用性程度的。

百度 +网盘,百度 网盘,没有什么大的差别,虽然搜索结果上 百度 网盘 的结果是前者的2倍,但对用户没产生明显影响。

减号,让搜索中尽可能不出现减号之后的关键词

搜索百度会有 百度一下,结果1亿条。

采用减号,百度 -一下,可见效果还是比较显著的,截图之外也如此,结果也是1580万条,较少。

site语法,site:qq.com,可以看到很多腾讯公司的子域名,有助于腾讯公司域名资产的收集,对于其他域名是同样道理。

filetype语法,filetype:pdf,搜索出来的几乎全都是pdf文档,pdf也可以替代,例如ppt/doc/xls等文档类型均可,如果使用谷歌php/asp/action/aspx这种后缀也可以搜索。

cache语法,cache:www.pku.edu.cn,可以找到北京大学主页的缓存,但是需要用谷歌,百度不支持,缓存的是2天前的。

info语法,可以显示在标题,url,网页说明中的关键词信息,info:pku.edu.cn,可以看到很多的邮箱,子域名以及外链的信息,可以和别的语法先后使用,获取更多信息。

phonebook语法,phonebook:russia,可以显示俄罗斯的开源个人电话信息查询站点,可以认为是开源社工库,当然USA/UK等国家的也都可以找到。

 link,define,inanchor,datarange,related,music,movie,wheather等语法处境和加号类似,应用场景不是很多,可用性较差,但并不代表它们是没用的,只是在渗透测试信息收集中作用不明显。

接下来介绍的是很重要的6个语法。

intitle语法,intitle:后台,这个时候会发现能看到很多的后台站点出现,而在站点标题无疑都有后台这个字眼,当然换成别的词汇或者英文都是可以的。

allintitle语法,allintitle:后台 登录,标题中尽可能显示后台和登录两个关键词。

intitle:后台 intitle:登录 ,可以搜到更多结果,而且在中文字符上百度远好过谷歌,谷歌对于显示的页数有限制,只能查看20个页面的结果。

intitle:后台 登录,则表示标题一定要有后台,但是 登录 可以出现在网页说明中。

不过实际上,搜索语法与最终显示结果并不是绝对的,只能说不同的语法更倾向于某种搜索结果。

能用intitle最好不选用allintitle。

 intext语法,intext:百度,因为百度不明显,这个用谷歌展示,在网页说明中会出现 百度 这个关键词的字眼。

allintext语法,allintext:百度 周鸿祎,在网页说明中有百度 周鸿祎 两个关键词同时出现。allintext:周鸿祎 百度,两个关键词调转位置,结果基本一样。

inurl语法,inurl:admin,在网页URL中一定含有admin这个关键词,administrator也是包含admin的,一般这样的站点多是后台。

allinurl语法,allinurl:admin login,在URL中含有admin,login,百度表现不明显,用谷歌展示出来。

现在说一些组合语法

intitle:index.of,其中的点表示一个单字符,index.of出现在标题中,打开第一个链接,这种类型目录可以发现很多。

 intext:"the WordPress" inurl:wp-config ext:txt,网页说明精准含有the WordPress这个关键词,url中含有wp-config,链接的文件扩展名是txt文件,包含对方的配置文件信息。

 intitle: "Index of" intext:log,在网页标题中精准含有Index of,网页说明中含有log关键词,获取一些日志类文件。

 site:com inurl:jboss filetype:log -github.com,站点一定是com的,url中含有jboss,文件类型是log,并且不能是来自github。

filetype:mdb inurl:com,文件类型是mdb的数据库文件,url中含有com,可以获取大量的数据库文件。

这里就用5个例子说明一下,场景一方面是参考他人案例,另外自己也需要根据实践,采用适合的组合拳。

搜索引擎高级语法需要掌握,搜索引擎直接提供的高级搜索框也应该熟悉里面各个选项的用途,在实际使用中也许更高效。

这是谷歌的高级搜索框,还有一大堆的解释说明,比较贴心。

还有搜索框工具,可以快速调节时间还有结果类型,verbatim是精准匹配的意思。

这是百度的高级搜索框,相比谷歌少了语言和地区选项,其他基本一样,倒是显得简约不少。

百度的搜索框工具倒是更齐全,除了时间还有文件类型,以及站点锁定功能,即使日常用起来也可以带来不少便利。

谷歌作为一个全球性搜索引擎,在爬取全球各国各地区网页上不遗余力,百度主要够专注于中国市场,在中文搜索上还是要略胜一筹,百度自建的这个生态可谓相当重要,例如百度百科,百度知道,百度文档等,因此在搜索国内站点时,谷歌百度结合使用会更好,而且谷歌对于频繁访问的行为还进行人机识别,但是国内访问百度还没有遇到过。

此外在国内,除去百度其他搜索也有自己的特色。

搜狗搜索,其中的搜狗微信和搜狗知乎是百度所欠缺的,也是搜狗独有特色,目前微信APP搜索功能显示结果很多就是搜狗的结果。

https://www.sogou.com/

微软必应搜索,目前国内的搜狗英文还有360英文搜索采用的都是必应提供技术支持,国外的雅虎搜索,除去雅虎日本外,也是完全由必应提供搜索技术支撑,必应学术在搜索英文文献上比百度好很多,可以一定程度替代谷歌。即使在国内如果搜索英文技术文章,使用必应国际版,也是很好的。

https://cn.bing.com

国内还有的神马搜索,只做移动端;360搜索,靠360浏览器、360导航、360安全卫士引流量;中国搜索,号称搜索引擎国家队。这几个很多搜索引擎高级语法都不怎么支持。

选择百度来演示,并不是说百度比谷歌好,而是为了说百度有自己天然的本土优势,对中国站点信息收集,绝对不能轻视。

目前掌握搜索引擎核心技术的国家有4个,中国,美国,俄罗斯,韩国。

俄罗斯的yandex是独联体国家市场份额最大的一家,如同百度在中国地位,在site收集国内站点子域名的时候,可以给你带来意想不到的收获,不过也有人机识别认证,如果收集俄语信息,yandex是你绕不开的一个,此外俄罗斯的mail.ru搜索也占据较大市场,主营社交软件、邮箱和视频业务,主要做俄语搜索。

yandex英文版

mail.ru俄语版

https://mail.ru/

韩国人的第一大搜索引擎同样不是谷歌,而是Naver搜索,而且该公司是著名社交软件Line的开发者,朝鲜语的搜索领域也是不可或缺的。

国外的一个号称隐私保护搜索站点DuckDuckGo搜索千万不要错过,尤其是对于注重隐私的人,每次访问这个网站就相当于第一次访问,它们的盈利手段是基于关键词来展示广告,而不是跟踪分析你的喜好来展现。

DuckDuckGo,打开直接显示中文,对于隐私保护,我有点质疑。

https://duckduckgo.com

美国人的一个手册,google hacking:渗透测试者的利剑,对谷歌搜索语法进行了详尽分析,京东有售中文翻译版。

这里有一个PPT版的,而且是书的作者早年做的。

http://www.mrjoeyjohnson.com/Google.Hacking.Filters.pdf

防止信息泄露和服务器入侵的措施:(来自freebuf-K0rz3n)

1.检查所有的文档能否被Google搜索到,避免敏感文件能出现在公众的视野中

2.选择一个强大的自动化工具来扫描你网站上是否有信息的泄露

3.不要使用默认的登录入口,以防止登录入口被hacker猜解

4.关闭数据库的远程管理工具

5.删除明显的显示软件版本的信息

6.配置服务器只能下载特定的文件类型(白名单比黑名单要简单有效得多)

7.正确的配置你的服务器,不要抱有侥幸心理,任何的松懈带来的灾难是巨大的

8.不要把源码的备份放在未经授权就能访问的地方,并且及时删除网站上的无用的备份文件

9.不要使用弱密码,防止攻击者轻易攻破后台

10.登录请加上强度相对较高的验证手段,防止攻击者采用爆破的手段

11.关闭服务器不必要的端口

12.请不要使用网站上的任何信息作为密码,否则都属于容易爆破的类型

13.备份的源代码请经过专业的混淆,防止被下载之后轻易读取到内容

14.及时更新服务器的系统,修复潜在的漏洞

15.安装正规的安全防护软件

破除一个误解,千万不要以为常规搜索引擎就可以覆盖大部分,不是如此,淘宝,京东,亚马逊,wikihow,以及一些垂直的专业类站点都是很重要的信息获取途径,现在这个时代信息很多,这也造成了更多的信息鸿沟和信息壁垒,人与人之间的信息不对等反而愈发扩大,如何高效获取有效且专业及时的信息,显得尤为必要。

转载于:https://www.cnblogs.com/landesk/p/10903671.html

PJzhang:搜索引擎高级语法与渗透测试相关推荐

  1. 【教程】搜索引擎高级语法

    [教程]搜索引擎高级语法 备注 一.完全匹配("") 二.不包含( -) 三.包含url(inurl:) 四.包含title(intitle:) 五.指定网站(site:) 六.指 ...

  2. 你真的会搜索吗——搜索引擎高级语法之一

    有句话说:网络上的信息是海量的,就看你会不会搜索.掌握搜索引擎的高级语法,可以让你在查找信息时事半功倍. 大家常用的搜索引擎有百度.搜狗.谷歌.bing.360搜索等,一般的搜索方法就是通过关键字来搜 ...

  3. 能把百度玩出花样的人肯定不简单,分享几个鲜为人知的搜索引擎高级语法

    「作者主页」:士别三日wyx 「作者简介」:CSDN top100.阿里云博客专家.华为云享专家.网络安全领域优质创作者 「专栏简介」:此文章已录入专栏<网络安全快速入门> 渗透过程中,通 ...

  4. 搜索引擎你真的会用吗?学会这几个高级语法让你事半功倍

    ​​​​​​概述 我们每天都在使用搜索引擎进行信息搜索,搜电影,搜歌曲,搜小说等等,有时候我们想从互联网中得到我们所需的信息时却需要点击下一页又下一页地寻找,浪费了很多时间,那么我们该如何在海量信息中 ...

  5. Web渗透测试学习笔记

    文章目录 第一章 信息收集 1.1域名信息 1.1.1whois查询 1.1.2备案信息查询 1.2敏感信息 1.3子域名信息 1.3.1 子域名检测工具 1.3.2搜索引擎枚举 1.3.3第三方聚合 ...

  6. 网络安全技术方面渗透测试入门笔记

    一.网站基础与信息收集 1.网站的基本概念 http://192.168.80.128/shownnew.asp?id=16 访问的是网站中的那个网页? shownews.asp 这是一个静态还是动态 ...

  7. 渗透测试前的信息收集(玄魂磐石计划课件搬运)

    1.常规信息收集之域名 备案号查询 备案号是网站是否合法注册经营的标志,可随时到国家工业和信息化部网站备案系统上查询该ICP备案的相关详细信息. 网站:www.beianbeian.com 子域名发现 ...

  8. 渗透测试——搜索引擎

    渗透测试--搜索引擎 Google 介绍 谷歌作为最大的搜索引擎,利用其强大的搜索能力可以方便快捷的找到我们需要的信息,例如:子域名.后台管理地址.敏感信息.以及可能存在漏洞的网页 通配符 通配符 语 ...

  9. 渗透测试-----信息收集(通过DNS解析找IP地址、CDN、IP查询、IP物理地址、搜索引擎、网站信息收集)

    文章目录 渗透测试 信息收集 一.IP地址信息收集 1. 通过DNS解析找IP地址 1.1 ping命令 1.2 nslookup命令 1.3 dig工具 1.4 dnsenum 1.5 站长工具 2 ...

最新文章

  1. C++中的双冒号(::)
  2. Linux下Apache日志分析工具--AWStats安装使用
  3. JS类的封装及实现代码
  4. mysql连接编程环境_C++连接MySQL(一):环境配置和实例
  5. DL之VGG16:基于VGG16迁移技术实现猫狗分类识别(图片数据量调整→保存h5模型)
  6. 【Linux】一步一步学Linux——rev命令(57)
  7. Java中定义实例变量时指定初始化值顺序
  8. CF438E-The Child and Binary Tree【生成函数】
  9. 机器人穿法_(图解)机器人系统组成介绍
  10. 中值滤波去除图像噪声的matlab程序
  11. 1 SD配置-企业结构-定义-定义销售组织
  12. 手机发送验证码的业务逻辑探究-主要是安全性,响应性
  13. 【基础练习】【区间DP】codevs1090 加分二叉树题解
  14. Firefox6 使用 firebug 解决方法 以及迅雷(thunder)插件报错
  15. 沸点百度文库下载器v2.3.3.2绿色版
  16. 联想教育应用使用说明(7.6版本)——第2章 联想教育应用的首次部署
  17. html5如何直接源码,html5源码可以直接使用吗
  18. 解决: 在类xxx 中找不到 main 方法, 请将 main 方法定义为: public static void main(String[]
  19. 六、路由(routing)
  20. 【你好,windows】Windows 10 X64 19H2 18363.1556 终结版2021.5.16

热门文章

  1. 【图像处理】图像分割之(一~四)GraphCut,GrabCut函数使用和源码解读(OpenCV)
  2. Vue3的vue-router超详细使用
  3. Sass文件的导入import和Partials
  4. vue实现中英文网站配置
  5. 2020年安卓各大应用市场份额占比分析,Android自定义View详解
  6. layer数据表格换行
  7. 选题难没思路?3招教你轻松建立小红书爆款选题库
  8. Spring2.5.X与Junit4.5配搭问题
  9. Kubeadm搭建高可用K8S(四)Dashboard安装配置
  10. cox(Quaro)对设计的崭新定义,改变我的人生