TDH 常见运维命令(部分)
通过一条命令来搜集所有节点下regionServer的Exception日志:
cat /etc/hosts | grep 172.16 | awk '{print $1}' | xargs -i ssh {} " grep Exception -R /var/log/hyperbase1/*log"
截图如下。日志较多截不完,就直接取消了
查找InceptorServer进程或者ES进程用到的jar包以及jar包对应的md5码
jps | grep InceptorServer| awk '{print $1}' |xargs -i jinfo {} | grep java.class.path|awk -F = "{print $2}" | xargs -d : -i echo {} | xargs md5sum
查看ES进程对应的线程以及通过shell命令来查看进程所用到的端口号
jps | grep Elasticsearch | awk '{print $1}' | xargs -i top -Hb -p {} netstat
快速查找某一个class所对应的jar包方法
find /usr/java/jdk1.7.0_71/lib -name "*jar" | awk '{print $1}' | xargs -i jar tf {} | grep JavaInterface
免密登录练习
正排索引与倒排索引的理解
倒排索引和正排索引都是检索的方式,正排索引是 先扫描 文档doc 从中找到相应的 word 词汇,在一些场景中比较适用,但是例如 根据关键词,找到相应的文档全文,就可能需要扫描文档结束后才知道
文档中是否存在 关键词,会比较不合理,因此 可以使用倒排索引,用关键词和文档的映射去找到关键词,定位文档,效率会有所提升。
FST与Hashmap对比的理解
FST 是 lucene4中的一种数据结构。在部分场景中,可以使用 FST 替代 HashMap。
同时 FST也有相应的优点。
结构更加紧凑,压缩相应的存储空间。不考虑输出,是一个无环的 DFA
通过curl命令来执行以下es api操作 创建索引、插入数据、查询数据、带条件查询数据
创建索引:curl -XPUT 'tdh198:9200/xue_test/?pretty'
插入数据:curl -XPUT 'tdh198:9200/xue_test/dev/1?pretty' -d '{
"firstname": "San",
"lastname": "Zhang",
"age": 26,
"on_board_date": "2015-10-31",
"hometown": "Beijing",
"school": "Nanjing University",
"married": false,
"about": "I love Beijing Opera"
}'
查询数据:curl -XGET 'tdh198:9200/xue_test/dev/1?pretty'
带条件查询数据:curl -XPOST 'tdh198:9200/xue_test/_search' -d '{
"query": {
"match_all":{}
}
}
在 search 界面中对应
数据对应为
构建索引时,number_of_shards 和 number_of_replicas 注意事项
每个硬盘一个shard,一个shard存储不要超过30G。
初次索引的时候,把 replica 设置为 0,提高性能;
ES通过Shard Replication 保证Node节点出现故障时出现数据的完整性。
在Relocating的时候,Replica 从Primary 进行Recover时,Primary会先Snapshot Lucene,
然后拷贝数据到Replica,最后通过回放Translog 保证数据的一致性。
常见的分词方式都有哪些及概述 (借鉴网上资料)
英文分词器:英文分词的基础是以空格切分为一个个的单词,但是不同的分词器会在此基础上存在细微的差别。在Transwarp Search中,可选的英文分词器有两种:一是标准分词器(standard analyzer):标准分词器根据Unicode Consortium的定义的单词边界(word boundaries)来切分文本,然后去掉大部分标点符号,最后,把所有词转为小写;二是语言分词器(english analyzer): english 分词器自带一套英语 停用词库 ——像 and 或 the 这些与语义无关的通用词。这些词被移除后,把所有词转为小写,并根据语法规则转化成词根。
中文分词器:不同于英文分词规则,中文难以用空格来分词,只能逐字切分,所以使用的是另外一套分词器。在Transwarp Search中可选的中文分词器有两种; 一是ik分词器: ik分词使用了“正向迭代最细粒度切分算法”,简单说来就是Segmenter会逐字识别词元,并去掉停用词,将能够分出来的词元全部输出; 二是mmseg分词器: mmseg分词器是基于正向最大匹配算法将文本切分为歧义最小的token。
常见运维命令 rest api 篇
_cat 查看 集群状态 设计 shard node cluster
_cat/segments
查看各index的segment详细信息,包括segment名, 所属shard, 内存/磁盘占用大小, 是否刷盘, 是否merge为compound文件等.
查看index详细信息(/_cat/indices)
查看集群中所有index的详细信息,包括index状态,shard个数(primary/replica),doc个数等,可参考help. 可以查看指定index的信息(/_cat/indices/${index})
查看alias详细信息(/_cat/aliases)
查看集群中所有alias信息,包括alias对应的index, 路由配置等. 可以查看指定alias的信息(/_cat/aliases/${alias}).
查看shard详细信息(/_cat/shards)
查看各shard的详细情况,包括shard的分布, 当前状态(对于分配失败的shard会有失败原因), doc数量, 磁盘占用情况, shard的访问情况(如所有get请求的成功/失败次数以及对应耗时等). 可以指定index只查看某个index的shard信息(/_cat/shards/${index}).
查看单节点分配信息(/_cat/allocation)
查看单节点的自定义属性(/_cat/nodeattrs)
查看集群当前状态(/_cat/health)
查看集群各个节点的当前状态(/_cat/nodes)
查看集群master节点(/_cat/master
查看集群fielddata内存占用情况(/_cat/fielddata)
查看集群doc数量(/_cat/count)
查看集群的pendingTask情况(/_cat/pending_tasks)
查看各个节点的插件信息
curl "tdh198:9200/_cat/plugins?v"
查看集群的recovery情况
curl -XGET 'tdh198:9200/_cat/recovery?v'
查看集群各节点的threadpool统计信息(/_cat/thread_pool)
curl "tdh198:9200/_cat/thread_pool?v"
部分效果图:
查看各个节点信息 插件信息
查看集群的recovery情况
curl -XGET 'tdh198:9200/_cat/recovery?v
查看集群各节点的threadpool统计信息(/_cat/thread_pool)
curl "tdh198:9200/_cat/thread_pool?v"
TDH 常见运维命令(部分)相关推荐
- oracle dg 数据不一致,DG常用运维命令及常见问题解决
DG常见运维命令及常见问题解决方法 l> DG库启动.关闭标准操作 Dataguard关闭 1).先取消日志应用 alter database recover managed standby d ...
- 实战为上!深入解析20个运维命令
实战为上!深入解析20个运维命令 http://mp.weixin.qq.com/s?__biz=MjM5NTU2MTQwNA==&mid=2650652657&idx=1&s ...
- 【微学堂】实战为上!深入解析20个运维命令
[微学堂]实战为上!深入解析20个运维命令 原创 2016-08-24 微学堂 CU技术社区 第19期微学堂预告: 拒绝套路!Docker技术快速精通指南 本文编辑整理自[微学堂]第十八期活动实录. ...
- Linux服务器常见运维性能测试(3)CPU测试super_pi、sysbench
Linux服务器常见运维性能测试(3)CPU测试 常见性能测试软件 CPU测试:super_pi (计算圆周率) CPU测试:sysbench(CPU功能测试部分) 下载安装 sysbench综合测试 ...
- Linux服务器常见运维性能测试(1)综合跑分unixbench、superbench
Linux服务器常见运维性能测试及压力测试拷机稳定性系列(1)综合跑分unixbench.superbench 常见性能测试软件 综合测试:1.UnixBench 测试项 安装及使用 综合测试:2.s ...
- 工具猿之Linux运维命令总结以及场景运用
Linux运维命令汇总与使用 一.线上查询及帮助命令 命令 功能说明 何时使用(举例不全) man 查看命令帮助,命令的词典,更复杂的还有info.但不常用. 当你需要查看某个命令的参数时只要man一 ...
- 银河麒麟操作系统常见运维问题
目录 银河麒麟 常见运维问题 1 安装问题 1) 高级安装ARM版本系统,新建分区sda1必须是/boot分区,sda2是根分区? 2) 用光盘安装或者U盘安装时,无法进入安装界面问题 3) 麒麟系 ...
- 大数据常见运维问题汇总
大数据常见运维问题汇总 其他安装问题: 1.IDEA安装与配置 IntelliJ IDEA使用教程 (总目录篇)_请叫我大师兄-CSDN博客_intellijidea使用教程 2.IntelliJ I ...
- 10个实用Linux运维命令
前言 玩过Linux的人都会知道,Linux中的命令的确是非常多,但是玩过Linux的人也从来不会因为Linux的命令如此之多而烦恼,因为我们只需要掌握我们最常用的命令就可以了,因为不想在使用时总是东 ...
最新文章
- 运行python需要网吗-python搭建网站(想学Python有什么建议吗?)
- [面向对象] ABAP中类重构助手Refactoring Assitant
- 未来:万物皆互联、全民皆社交,人人都是马化腾
- Linux下的进程概论与编程二(进程控制)
- 一次简单的sql性能比较
- 跟我学 Java 8 新特性之 Stream 流(三)缩减操作
- 【腾讯Bugly干货分享】Android内存优化总结实践
- el表达式取值优先级
- python访问数据库如何解决高并发_使用 Python 和 Oracle 数据库实现高并发性
- Python 配置文件之ConfigParser模块(实例、封装)
- Bug提交规范及注意事项
- 【报告分享】清华大学-2019人工智能发展报告.pdf(附394页报告下载链接)
- 学三菱plc编程应该先学什么?
- 美观!!大气!!! LVGL『Color picker颜色选择器控件』介绍
- labview温度采集系统,温度计正负范围内显示,附加温度预警操作部分(初学者~)
- win10用linux命令关机,Win10使用PowerShell命令让局域网电脑重启关机操作
- 1197 山区建小学
- linux cp改文件名,更改Linux `cp`命令以复制文件组
- 2021.1.17-Robocup 2D学习日志
- 在不停业务的情况下重启ES集群中的节点