服务器日志的定义:

服务器日志,记录服务器接收客户端处理请求,并记录服务器对这条请求处理结果以.log结尾的文件

服务器日志是服务器自动生成的,一般以日期命名

可以用来记事本直接打开查看

服务器日志的作用

了解搜索引擎抓取网页的相关数据

到访抓取等数据

了解网站内容及链接是否正常

http状态码及爬行收录情况

对网站维护有非常重要的指导作用

根据蜘蛛爬行的频率等,判断蜘蛛喜好及文章质量的高低

服务器日志的获取:

不同的空间存放不一样,我们以西部数码Linux为例

服务器日志读取重点

访问时间

被访问的文件地址

搜索引擎蜘蛛或者用户浏览器

访问者的IP

访问状态码

服务器日志读取:

POST:提交。

GET:访问。

61.139.126.228--[26/sep/2013:16:14:37 +0800]

"POST/install/index.php HTTP/1.0"200 352

"http://tfwx90.gotoip3.com/install/index.php?step=3"

"Mozilla/5.0(windows NT 5.1)

Applewebkit/537.36(KHTML,like Gecko)

chrome/28.0.1500.72 Safari/537.36"

2013年9月26日用户通过/install/index.php页面成 功提交了信息(这个是网站程序安装信息)。

读懂iis日志:

date表示记录访问日期。

time访问时间。

cs-method表示访问方法。

常见的有两种:

——GET,就是平常我们打开一个URL访问的动作。

——POST,提交表单时的动作。

cs-uri-stem就是访问哪一个文件资源。

cs-username访问者名称。

c-ip客户端ip

其中c-ip可以查询对方(运行中输入nslookup可以查询DNS信息)

cs-version客户端协议版本。

——HTTP/1.0

——HTTP/1.1

cs-User-Agent)用户代理。

——可以分辨是用户还是搜索引擎的蜘蛛。

csReferer)引用页网址。

sc-status状态。

  • 200:成功。
  • 301:永久重定向。302暂时定向
  • 403:没有权限。
  • 404:打不开该页面。
  • 500:内部服务器错误。
  • 503:服务器超时。

sc-substatus协议子状态。sc-bytes服务端传送到客户端的字节大小。

1**:请求收到,需要继续处理。

2**:请求已成功被服务器接收、理解、并接受。

——200:请求已成功,请求所希望的响应头或数据体将随此响应返回(可以正常浏览网页)。

3**:完成此请求需要客户端进一步处理。

——301:永久重定向,被请求的资源已永久移动到新位置。

4**:请求包含错误语法或不能完成(客户端错误)。

——404:找不到文件。

5**:服务器执行有效请求失败(服务器错误)。

——500:内部服务器错误。

——503:服务器超时

iis日志读取:

2013-09-24 16:20:53 GET /plus/guestbook.php - 220.181.108.173 HTTP/1.1

Mozilla/5.0+(compatible;+baiduspider/2.0;++http://www.baidu.com/search/spider.html) - 200 0 7351

在2013年09月24日IP为220.181.108.173的百度蜘蛛来爬行/plus/guestbook.php成功。

iis日志读取:

2013-09-24 16:27:50 GET /sure/MissiveShow.asp - 66.249.74.134 HTTP/1.1

Mozilla/5.0+(compatible;+googlebot/2.1;++http://www.google.com/bot.html) - 404 0 1468

在2013年09月24日IP为66.249.74.134的谷歌蜘蛛未找到/sure/MissiveShow.asp网页

功能:能分析多种形式格式日志文件,分析结果形成htm格式的网页。

分析方法:可以看单个日志文件数据,也可以对比连日数据进行分析。

重点数据:概要分析:目标蜘蛛访问次数、停留时间、抓取量。对应问题:     1.访问次数少、2.抓取量少。

光年SEO日志分析系统2.0

优点

针对seo数据分析设计,分析纬度较其他软件更有针对性

快速分析较大的日志文件,每小时分析40G左右的日志文件

能自动判断日志格式

软件容量小(1M多),操作简单、绿色免安装版

缺点:

日志分析的维度还太小

数据分析准确度有待提高

分析日志发现并解决问题

访问次数少

增加外链、更新时间规律

抓取量少

增加文章质量,坚持更新,内部优化做内链

文件夹爬取量低

内部优化,做好内链优化

页面未被抓取或被抓取的页面数较少(数量非次数)

提高文章质量,做好内链优化

隐私文件被抓取

采用robots.txt或者robots.meta标签等限制文件的抓取

修正返回错误的页面

检查相关文件或服务器问题(异常时需关注,情况较少)

返回404的文件要查询是否需要补上文件

对网站服务器日志进行分析相关推荐

  1. 怎么查看访问网站服务器记录,如何快速分析网站服务器日志

    原标题:如何快速分析网站服务器日志 服务器日志是一个文本,类似txt文本,是服务器自己生成的,也称为网站日志.通常Windows服务器的日志叫做Apache日志,Linux服务器日志称为IIS日志. ...

  2. 网站服务器日志都有哪些,网站服务器日志在哪里看?

    作者:萧红SEO 网站服务器日志在哪里看?问这话的人应该新手站长了,对于做网站的站长来说,查看网站服务器日志是经常性的工作.可是对于一些新手站长来说却并不是件容易的事情了. 站长也并非是全能的,有些站 ...

  3. 如何分析网站服务器日志,小白必看,如何通过查看网站日志分析数据?

    一.网站日志的概念 网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,确切的讲,应该是服务器日志.网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请 ...

  4. 网站蜘蛛日志如何分析?对优化有用吗?

    平时我们在做网站优化的时候,想知道有哪些搜索引擎平的蜘蛛来访问过咱们网站,或者是网站为啥不收录了等一些原因导致网站出现了问题!那么这个时候咱们就可以通过网站日志下载下来,查看里面的各种蜘蛛来路,进行分 ...

  5. 网站服务器日志分析,如何进行网站日志分析(理论篇)

    搜索引擎通过蜘蛛爬行抓取网页,通过分析网站日志,可以了解蜘蛛在网站中的抓取规律,以及网站在结构.收录.内容更新等方面存在的不足. 在进行日志分析时,一个可以事半功倍的工具是必不可少的,例如光年日志分析 ...

  6. 网站服务器日志软件,网站日志分析工具软件-360星图完整单机版

    网站日志分析工具软件-360星图完整单机版 书法字体2018.06.14360星图 360星图是360旗下开发的一款实用的网站日志分析工具软件.利用360星图可以可以快速生成直观的网站日志报告,比起用 ...

  7. 服务器日志法网站分析的原理及优缺点

    [前言] 应朋友们的要求,我还是写一篇关于服务器日志法进行网站分析的原理以及它的优缺点是什么.请朋友们注意,网站服务器日志法并不容易进行,初学者,以及在绝大多数情况下,进行以用户行为分析为核心的网站分 ...

  8. 这些 Shell 分析服务器日志命令集锦,收藏好

    自己的小网站跑在阿里云的ECS上面,偶尔也去分析分析自己网站服务器日志,看看网站的访问量.看看有没有黑阔搞破坏!于是收集,整理一些服务器日志分析命令,大家可以试试! 1.查看有多少个IP访问: awk ...

  9. shell在手分析服务器日志不愁

    自己的小网站跑在阿里云的ECS上面,偶尔也去分析分析自己网站服务器日志,看看网站的访问量.看看有没有黑阔搞破坏!于是收集,整理一些服务器日志分析命令,大家可以试试! 1.查看有多少个IP访问: awk ...

最新文章

  1. python 速度矢量_最近邻搜索4D空间python快速-矢量化
  2. Python之Numpy数组拼接,组合,连接
  3. android binder 实例
  4. 04:网络层协议介绍
  5. MYSQL查表的字段名称,字段类型,字段长度,字段注释的SQL语句
  6. qt 添加依赖库lib_在QT中添加LIB的方法
  7. 人工智能ai 学习_学习代理| 人工智能
  8. Git 基础(七)—— 远程仓库(GitHub)
  9. 扫盲:集线器、网桥、交换机、路由器、网关大解析
  10. 服务器挂起文件怎么删除,挂起的更改
  11. 你值得安装的24个chrome插件!!!
  12. cesium获取模型高度_Cesium专栏-空间分析之剖面分析(附源码下载)
  13. 【程序源代码】小程序商城系统(CoreShop)
  14. mysql mysql5.7两个服务_MySQL 5.7.15 两台服务器双实例相互复制
  15. java只更新部分图像,java – 绘制从角落偏移的图像的某些部分...
  16. 判断给定的一串字符是否为“回文”。所谓“回文”是指顺读和倒读都一样的字符串。
  17. 用计算机弹音乐之声,弹响第一个音符
  18. 蓝桥杯 基础练习 十进制转十六进制(C++)
  19. php writevarint64_PHP浮点数的一个常见问题的解答
  20. [项目管理-22]:项目中开环、闭环、安全、监控四种沟通模型:UDP/TCP/SCTP/PID模型

热门文章

  1. css3 走马灯效果
  2. c语言程序设计教程龚尚福,C语言程序设计教程
  3. 便携式计算机功能,便携式笔记本
  4. One-out-of-Many Proofs: Or How to Leak a Secret and Spend a Coin 学习笔记
  5. win平台搭建Lnmp环境
  6. 性能测试需求分析 PV,响应时间、QPS、TPS
  7. Ribbon和Nginx的区别
  8. qeephp 查询对象 QDB_Table_Select 详解
  9. js 时间转东八区_dayjs处理utc转换
  10. Redis:限流算法