通过一条命令来搜集所有节点下regionServer的Exception日志:

cat /etc/hosts | grep 172.16 | awk  '{print $1}' | xargs -i ssh {} " grep Exception -R /var/log/hyperbase1/*log"

截图如下。日志较多截不完,就直接取消了

查找InceptorServer进程或者ES进程用到的jar包以及jar包对应的md5码

jps | grep InceptorServer| awk '{print $1}' |xargs -i  jinfo {} | grep java.class.path|awk -F = "{print $2}" | xargs -d : -i echo {} | xargs md5sum

查看ES进程对应的线程以及通过shell命令来查看进程所用到的端口号

jps | grep Elasticsearch | awk '{print $1}' | xargs -i top -Hb -p {} netstat

快速查找某一个class所对应的jar包方法

find /usr/java/jdk1.7.0_71/lib -name "*jar" | awk '{print $1}' | xargs -i jar tf  {} | grep JavaInterface

免密登录练习

正排索引与倒排索引的理解

倒排索引和正排索引都是检索的方式,正排索引是 先扫描 文档doc 从中找到相应的 word 词汇,在一些场景中比较适用,但是例如 根据关键词,找到相应的文档全文,就可能需要扫描文档结束后才知道

文档中是否存在 关键词,会比较不合理,因此 可以使用倒排索引,用关键词和文档的映射去找到关键词,定位文档,效率会有所提升。

FST与Hashmap对比的理解

FST 是 lucene4中的一种数据结构。在部分场景中,可以使用 FST 替代 HashMap。

同时 FST也有相应的优点。

结构更加紧凑,压缩相应的存储空间。不考虑输出,是一个无环的 DFA

通过curl命令来执行以下es api操作   创建索引、插入数据、查询数据、带条件查询数据

创建索引:curl -XPUT 'tdh198:9200/xue_test/?pretty'

插入数据:curl -XPUT 'tdh198:9200/xue_test/dev/1?pretty' -d '{

"firstname":        "San",

"lastname":         "Zhang",

"age":              26,

"on_board_date":    "2015-10-31",

"hometown":         "Beijing",

"school":           "Nanjing University",

"married":          false,

"about":            "I love Beijing Opera"

}'

查询数据:curl -XGET 'tdh198:9200/xue_test/dev/1?pretty'

带条件查询数据:curl -XPOST 'tdh198:9200/xue_test/_search' -d '{

"query": {

"match_all":{}

}

}

在 search 界面中对应

数据对应为

构建索引时,number_of_shards 和 number_of_replicas 注意事项

每个硬盘一个shard,一个shard存储不要超过30G。

初次索引的时候,把 replica 设置为 0,提高性能;

ES通过Shard Replication 保证Node节点出现故障时出现数据的完整性。

在Relocating的时候,Replica 从Primary 进行Recover时,Primary会先Snapshot Lucene,

然后拷贝数据到Replica,最后通过回放Translog 保证数据的一致性。

常见的分词方式都有哪些及概述  (借鉴网上资料)

英文分词器:英文分词的基础是以空格切分为一个个的单词,但是不同的分词器会在此基础上存在细微的差别。在Transwarp Search中,可选的英文分词器有两种:一是标准分词器(standard analyzer):标准分词器根据Unicode Consortium的定义的单词边界(word boundaries)来切分文本,然后去掉大部分标点符号,最后,把所有词转为小写;二是语言分词器(english analyzer): english 分词器自带一套英语 停用词库 ——像 and 或 the 这些与语义无关的通用词。这些词被移除后,把所有词转为小写,并根据语法规则转化成词根。

中文分词器:不同于英文分词规则,中文难以用空格来分词,只能逐字切分,所以使用的是另外一套分词器。在Transwarp Search中可选的中文分词器有两种; 一是ik分词器: ik分词使用了“正向迭代最细粒度切分算法”,简单说来就是Segmenter会逐字识别词元,并去掉停用词,将能够分出来的词元全部输出; 二是mmseg分词器: mmseg分词器是基于正向最大匹配算法将文本切分为歧义最小的token。

常见运维命令 rest api 篇

_cat 查看 集群状态 设计 shard node cluster

_cat/segments

查看各index的segment详细信息,包括segment名, 所属shard, 内存/磁盘占用大小, 是否刷盘, 是否merge为compound文件等.

查看index详细信息(/_cat/indices)

查看集群中所有index的详细信息,包括index状态,shard个数(primary/replica),doc个数等,可参考help. 可以查看指定index的信息(/_cat/indices/${index})

查看alias详细信息(/_cat/aliases)

查看集群中所有alias信息,包括alias对应的index, 路由配置等. 可以查看指定alias的信息(/_cat/aliases/${alias}).

查看shard详细信息(/_cat/shards)

查看各shard的详细情况,包括shard的分布, 当前状态(对于分配失败的shard会有失败原因), doc数量, 磁盘占用情况, shard的访问情况(如所有get请求的成功/失败次数以及对应耗时等). 可以指定index只查看某个index的shard信息(/_cat/shards/${index}).

查看单节点分配信息(/_cat/allocation)

查看单节点的自定义属性(/_cat/nodeattrs)

查看集群当前状态(/_cat/health)

查看集群各个节点的当前状态(/_cat/nodes)

查看集群master节点(/_cat/master

查看集群fielddata内存占用情况(/_cat/fielddata)

查看集群doc数量(/_cat/count)

查看集群的pendingTask情况(/_cat/pending_tasks)

查看各个节点的插件信息

curl "tdh198:9200/_cat/plugins?v"

查看集群的recovery情况

curl -XGET 'tdh198:9200/_cat/recovery?v'

查看集群各节点的threadpool统计信息(/_cat/thread_pool)

curl "tdh198:9200/_cat/thread_pool?v"

部分效果图:

查看各个节点信息 插件信息

查看集群的recovery情况

curl -XGET 'tdh198:9200/_cat/recovery?v

查看集群各节点的threadpool统计信息(/_cat/thread_pool)

curl "tdh198:9200/_cat/thread_pool?v"

TDH 常见运维命令(部分)相关推荐

  1. oracle dg 数据不一致,DG常用运维命令及常见问题解决

    DG常见运维命令及常见问题解决方法 l> DG库启动.关闭标准操作 Dataguard关闭 1).先取消日志应用 alter database recover managed standby d ...

  2. 实战为上!深入解析20个运维命令

    实战为上!深入解析20个运维命令 http://mp.weixin.qq.com/s?__biz=MjM5NTU2MTQwNA==&mid=2650652657&idx=1&s ...

  3. 【微学堂】实战为上!深入解析20个运维命令

    [微学堂]实战为上!深入解析20个运维命令 原创 2016-08-24 微学堂 CU技术社区 第19期微学堂预告: 拒绝套路!Docker技术快速精通指南 本文编辑整理自[微学堂]第十八期活动实录. ...

  4. Linux服务器常见运维性能测试(3)CPU测试super_pi、sysbench

    Linux服务器常见运维性能测试(3)CPU测试 常见性能测试软件 CPU测试:super_pi (计算圆周率) CPU测试:sysbench(CPU功能测试部分) 下载安装 sysbench综合测试 ...

  5. Linux服务器常见运维性能测试(1)综合跑分unixbench、superbench

    Linux服务器常见运维性能测试及压力测试拷机稳定性系列(1)综合跑分unixbench.superbench 常见性能测试软件 综合测试:1.UnixBench 测试项 安装及使用 综合测试:2.s ...

  6. 工具猿之Linux运维命令总结以及场景运用

    Linux运维命令汇总与使用 一.线上查询及帮助命令 命令 功能说明 何时使用(举例不全) man 查看命令帮助,命令的词典,更复杂的还有info.但不常用. 当你需要查看某个命令的参数时只要man一 ...

  7. 银河麒麟操作系统常见运维问题

    目录 银河麒麟  常见运维问题 1 安装问题 1) 高级安装ARM版本系统,新建分区sda1必须是/boot分区,sda2是根分区? 2) 用光盘安装或者U盘安装时,无法进入安装界面问题 3) 麒麟系 ...

  8. 大数据常见运维问题汇总

    大数据常见运维问题汇总 其他安装问题: 1.IDEA安装与配置 IntelliJ IDEA使用教程 (总目录篇)_请叫我大师兄-CSDN博客_intellijidea使用教程 2.IntelliJ I ...

  9. 10个实用Linux运维命令

    前言 玩过Linux的人都会知道,Linux中的命令的确是非常多,但是玩过Linux的人也从来不会因为Linux的命令如此之多而烦恼,因为我们只需要掌握我们最常用的命令就可以了,因为不想在使用时总是东 ...

最新文章

  1. 运行python需要网吗-python搭建网站(想学Python有什么建议吗?)
  2. [面向对象] ABAP中类重构助手Refactoring Assitant
  3. 未来:万物皆互联、全民皆社交,人人都是马化腾
  4. Linux下的进程概论与编程二(进程控制)
  5. 一次简单的sql性能比较
  6. 跟我学 Java 8 新特性之 Stream 流(三)缩减操作
  7. 【腾讯Bugly干货分享】Android内存优化总结实践
  8. el表达式取值优先级
  9. python访问数据库如何解决高并发_使用 Python 和 Oracle 数据库实现高并发性
  10. Python 配置文件之ConfigParser模块(实例、封装)
  11. Bug提交规范及注意事项
  12. 【报告分享】清华大学-2019人工智能发展报告.pdf(附394页报告下载链接)
  13. 学三菱plc编程应该先学什么?
  14. 美观!!大气!!! LVGL『Color picker颜色选择器控件』介绍
  15. labview温度采集系统,温度计正负范围内显示,附加温度预警操作部分(初学者~)
  16. win10用linux命令关机,Win10使用PowerShell命令让局域网电脑重启关机操作
  17. 1197 山区建小学
  18. linux cp改文件名,更改Linux `cp`命令以复制文件组
  19. 2021.1.17-Robocup 2D学习日志
  20. 在不停业务的情况下重启ES集群中的节点

热门文章

  1. python函数——字典设置默认值 setdefault()
  2. 万众期待!西班牙人宣布武磊周三亮相
  3. 清华加强版「蚂蚁呀嘿」来袭,再也不用手动抠素材了!
  4. 2021年中国邮政行业发展现状分析,邮政服务业务收入有所下降「图」
  5. 【电商开发手册】订单-下单
  6. dell微型计算机测评,一款少女心的笔记本 戴尔灵越7000测评体验
  7. Unity 3D Text字迹模糊问题的解决方法
  8. DAY 11——12 零零碎碎
  9. tikz包 安装_LaTex各种安装
  10. 2022年7月2日(星期六):骑行海囗