本节书摘来自华章计算机《Splunk智能运维实战》一书中的第1章,第1.2节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默克(Derek Mock),译 宫鑫,康宁,刘法宗 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.2 索引文件和目录

从文件和目录输入数据是向Splunk导入数据最常用的方法。这种类型的输入主要是为了索引日志文件。几乎每个应用程序或系统都会产生日志文件,当中包括了我们想搜索和制作报表的很多数据。

Splunk能够持续监控写入现有文件的新数据或添加到目录中的新文件,并且能够实时索引这些数据。根据生成日志文件的应用类型不同,可以将Splunk设定为监控单一文件(基于其位置)或扫描整个目录并监控其中的所有文件。当生成的日志文件包含唯一的文件名(比如名字中含有时间戳)时,后一种配置更常使用。

本节将学习如何配置Splunk来持续监控并索引Splunk服务器上的一个日志文件,这个日志文件的内容会不断增加。本节将专门展示如何监控并索引Linux系统上的messages日志文件(/var/log/messages)。然而,同样的方法也适用于Windows系统上的日志文件,本书也提供了一个示例文件。但请不要用这种方法索引Windows事件日志,因为Splunk有专门的Windows事件输入法。

做好准备

要进行本节的操作,需运行Splunk Enterprise服务器并且有权限访问读取Linux上的/var/log/messages文件。没有其他先决条件。如果使用的不是Linux系统,并且/或者没有权限访问 Splunk服务器上的/var/log/messages,要使用本书提供的cp01_messages.log文件并将其加载到Splunk服务器上一个可访问的目录中。

如何操作

按下列步骤监控并索引文件内容。

1 . 登录Splunk服务器。

2 . 从右上角的主启动器,单击“添加数据”按钮。

3 . 在“选择数据类型”列表中,单击“文件或文件目录”。

4 . 在“索引此Splunk服务器上的所有文件”选项中单击“下一步”按钮。

5 . 选择“索引前预览数据”并输入日志文件路径(/var/log/messages或cp01_messages.log文件的位置)并单击“继续”按钮。

6 . 选择“开始一个新的源类型”并单击“继续”按钮。

7 . 假如你使用本书提供的文件或本地的/var/log/messages文件,数据预览将展示正确分行后的事件及时间戳标志。单击“继续”按钮。

8 . 会弹出“预览设置”框。在源类型输入linux_messages,单击“保存源类型”按钮。

9 . 会出现“源类型已保存”的提示框,选择“创建输入”按钮。

10 . 在“源”部分,选择“从Splunk本次访问的文件或目录中持续索引数据”,并填写数据路径。

如果只是想一次性加载某个文件,可选择“上传并索引文件”。这个选项适合于索引一组数据到Splunk,既可用来回填一些缺失或不完整的数据,也可仅仅为了利用其搜索和报表工具。

11 . 暂且忽略其他设定,直接单击“保存”。然后,在下一个界面中,点击“开始搜索”。在搜索栏,输入下列搜索,时间范围设定为“全部时间”:

在本节中,可直接使用常见的系统日志源类型,不过,创建新的源类型往往是更好的选择。根据数据源不同,系统日志格式可能差异很大。因为像提取字段这样的知识对象是建立在源类型之上的,为所有对象使用单一的系统日志源类型可能会较难搜索到所需的数据。

工作原理

当添加一个新的文件或目录来导入数据时,也就是在后台向inputs.conf文件添加新的配置节。Splunk服务器可包含一个或多个inputs.conf文件,它们位于$SPLUNK_HOME/etc/ system/local或Splunk 应用程序的local目录。

Splunk使用的输入类型是监控器,并被设定为指向某个文件或目录。如果设置对一个目录进行监控,目录中的所有文件都会被监控。当Splunk监控文件时,它会首先从头索引所有能读取的数据。完成后,Splunk将保留上次读取数据的位置记录,如有任何新的数据写入文件,它将读取这个数据并继续记录。这个过程几乎和在UNIX操作系统下使用tail命令相同。如需要监控一个目录,Splunk也会提供很多附加的配置选项,比如将不需要Splunk索引的文件列入黑名单。

若想获取Splunk配置文件的更多信息,请访问 http://docs.splunk.com/Documentation/Splunk/latest/Admin/ Aboutconfigurationfiles。

更多内容

除了可按照本节的方法通过Splunk的Web界面添加输入信息来监控文件和目录,还有其他方法来快速地添加多种输入信息。这些方法允许我们自定义Splunk提供的多种配置
选项。

通过CLI(命令行界面)添加文件或目录数据输入

除了通过GUI(图形用户界面)之外,还可通过Splunk CLI(command-line interface)来添加文件或目录输入。进入$SPLUNK_HOME/bin目录并执行下列命令(将需要监控的文件或目录替换成你自己的)。

UNIX系统:

Windows系统:

许多参数可以随文件位置一起被传送到监控器。参考Splunk技术文档来了解更多CLI数据输入的用法(http://docs.splunk.com/Documentation/Splunk/latest/Data/ MonitorfilesanddirectoriesusingtheCLI)。

通过inputs.conf添加文件或目录输入

另一种添加文件和目录输入的常用方法是手动将其直接添加至inputs.conf配置文件中。该方法常用于大环境中或配置Splunk 转发器来监控终端上的文件或目录。

编辑$SPLUNK_HOME/etc/system/local/inputs.conf并添加输入。添加完输入后,需要重启Splunk来识别更改。

UNIX系统:

Windows系统:

如需进行多个输入,编辑inputs.conf通常可以更快地添加新文件和目录来监控。编辑inputs.conf时,要确保使用正确的语法,并重启Splunk来使修改生效。此外,在inputs.conf文件中设定源类型是指定源类型的最佳做法。

通过Splunk CLI一次性索引数据文件

除了从Splunk GUI中选择“上传并索引文件”进行操作之外,也可使用很多CLI功能来执行一次性批量加载数据。

使用oneshot命令告知Splunk文件位置及所用参数,比如源类型:

另一种方法是将希望索引的文件放入Splunk spool目录,$SPLUNK_ HOME/var/spool/splunk,然后使用spool命令添加文件:

如使用Windows系统,应省略Splunk命令前的“./”。

索引Windows事件日志

Splunk针对一些源类型有专门的inputs.conf配置方式,其中包括监控Windows事件日志。通常来说,把Splunk通用转发器(UF)安装在Windows服务器上,配置后可转发Windows事件至Splunk索引器。对inputs.conf进行如下配置来实时监控Windows安全日志、应用程序日志和系统事件日志:

除非另外指定索引,否则事件数据默认会进入主索引。

另参见

《Splunk智能运维实战》——1.2 索引文件和目录相关推荐

  1. 《Splunk智能运维实战》——第1章 游戏时间——导入数据 1.1 简介

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第1章,第1.1节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默 ...

  2. 《Splunk智能运维实战》——第2章 深入数据——搜索和报表 2.1 简介

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第2章,第2.1节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默 ...

  3. 《Splunk智能运维实战》——1.6 使用通用转发器收集数据

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第1章,第1.6节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默 ...

  4. 《Splunk智能运维实战》——1.3 从网络端口获取数据

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第1章,第1.3节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默 ...

  5. 《Splunk智能运维实战》——1.5 使用模块输入

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第1章,第1.5节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默 ...

  6. 《Splunk智能运维实战》——1.4 使用脚本输入

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第1章,第1.4节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默 ...

  7. 《Splunk智能运维实战》——1.7 为本书加载样本数据

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第1章,第1.7节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默 ...

  8. 《Splunk智能运维实战》——3.11 制作折线图显示项目浏览量和购买量随时间的变化...

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第3章,第3.11节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克· ...

  9. 《Splunk智能运维实战》——3.6 制作每一主机不同请求方法数量的图表

    本节书摘来自华章计算机<Splunk智能运维实战>一书中的第3章,第3.6节,作者 [美]乔史·戴昆(Josh Diakun),保罗R.约翰逊(Paul R. Johnson),德莱克·默 ...

最新文章

  1. Python之列表list转换成字典dict的的方法【使用内置函数zip和dict快速搞定】
  2. linux复杂逻辑判断,20.5 shell脚本中的逻辑判断
  3. 贪心 - 划分字母区间
  4. elasticsearch api中的Delete By Query API操作
  5. 为什么说ip协议是无连接协议
  6. BZOJ 1070: [SCOI2007]修车(最小费用最大流)
  7. Solrj 存储一个point类型的字段
  8. ICT学习笔记(1) 网络以及网络模型的相关知识
  9. 数据结构与算法之树的遍历
  10. HLG 数字去重和排序II【二叉排序树】
  11. js如何在字符串里加变量
  12. 单页面应用(SPA)与多页面应用(MPA)的区别对比
  13. 微信小程序--几个常用标签
  14. git、KDiff3、Git Extensions
  15. mysql升级 增删改查询
  16. 去除百度推广等广告的插件神器
  17. 关于网络游戏的影响(腾讯游戏)
  18. 解决报错Cannot connect to the Maven process. Try again later. If the problem persists, check the Maven
  19. 如何使用repo管理本地私有仓库
  20. 漫威电影宇宙的正确观影顺序

热门文章

  1. 【毕业论文】开题报告写作技巧
  2. adum1201参考电路_采用ADuM1201的CAN总线隔离方法
  3. 瑞士PORTESCAP行星式齿轮箱R22HT
  4. UG NX机械手抓取实物的仿真,包涵PLC程序,触摸屏程序
  5. 场景管理方法之BVH介绍
  6. Chrome浏览器会重复发送两次请求,第2次还是空请求的原因与解决方法
  7. DIY基于树莓派的OpenTX航模遥控器(一)
  8. 1028 迪杰斯特拉算法
  9. Starr Insurance拓展马来西亚业务
  10. 本地缓存:为什么要用本地缓存?用它会有什么问题?