我会不间断的更新,维护,希望可以对正在找大数据工作的朋友们有所帮助.

第十九章目录

第十九章 Linux

19.1 Linux中、如何调整文件最大打开数

修改linux的软硬件限制文件/etc/security/limits.conf. 在文件尾部添加如下代码:
* soft nofile 65536
* hard nofile 131072修改完成后可以使用ulimit查看即可。注:
*  代表任何用户
soft 代表软件
nofile 最大文件
noproc 最大进程
65536 数量

19.2 请列举几个常用的Linux命令

man :帮助命令sudo : 获取root权限jps : 查看java进程ps -ef  : 查看进程ps -aux : 查看进程netstat -nltcp : 监听端口free : 内存查看top :动态 查看服务器资源信息uptime : 查看系统运行时长和负载率w : 查看系统运行时长和负载率df : 查看磁盘情况df -h /home : 查看home的使用情况iostat :  查看i/o情况tar :zip :unzip :gzip:gunzip:
rpm :yum :等等。

19.3 linux如何查看系统负载,内存.硬盘使用情况

系统负载命令:uptime、w、top
[root@node242 ~]# uptime12:06:18 up 6 days, 12:51,  3 users,  load average: 0.00, 0.01, 0.05[root@node242 ~]# w12:06:42 up 6 days, 12:51,  3 users,  load average: 0.00, 0.01, 0.05
USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
root     pts/0    10.0.151.251     08:53    3:11m  4:38   0.03s -bash
root     pts/2    10.0.157.236     11:39   27:03   0.01s  0.01s -bash
root     pts/3    10.0.151.253     11:47    2.00s  0.05s  0.01s w[root@node242 ~]# top
top - 12:07:29 up 6 days, 12:52,  3 users,  load average: 0.00, 0.01, 0.05
Tasks: 249 total,   1 running, 248 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.1 us,  0.1 sy,  0.0 ni, 99.7 id,  0.0 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem : 98824672 total, 73614424 free, 21389376 used,  3820868 buff/cache
KiB Swap:  4194300 total,  4194300 free,        0 used. 76497328 avail MemPID USER      PR  NI    VIRT    RES    SHR S  %CPU %MEM     TIME+ COMMAND7706 root      20   0   10.4g   1.1g  15900 S   1.0  1.1  76:26.86 java5461 root      20   0 3129584 459292  19332 S   0.7  0.5  55:37.83 java
......load average分别对应于过去1分钟,5分钟,15分钟的负载平均值。内存命令:free、top
[root@node242 ~]# freetotal        used        free      shared  buff/cache   available
Mem:       98824668    21388812    73435172        9616     4000684    76496944
Swap:       4194300           0     4194300磁盘命令:df
[root@node242 ~]# df
Filesystem               1K-blocks     Used  Available Use% Mounted on
/dev/mapper/centos-root   52403200  7870980   44532220  16% /
devtmpfs                  49398856        0   49398856   0% /dev[root@node242 ~]#
[root@node242 ~]# df -h
Filesystem               Size  Used Avail Use% Mounted on
/dev/mapper/centos-root   50G  7.6G   43G  16% /
devtmpfs                  48G     0   48G   0% /dev[root@node242 ~]# df -h /home
Filesystem               Size  Used Avail Use% Mounted on
/dev/mapper/centos-home  1.8T   48G  1.8T   3% /home查看io资源命令:iostat  (需要安装)

19.4 linux > 和 >> 的区别,常用查看日志命令

> : 覆盖文件,如果文件没有将会创建,并且将内容写到文件中,可以用于删除数据重新写入数据场景。
>> : 在文件末尾追加,如果文件没有将会创建,用于原文件数据不能丢失场景。

19.5 用shell脚本怎么替换字符串(现场写)

vi /home/test/rep.sh
#!/bin/bashori_str=$1
rep_str=$2
grep_word=$3
file_dir=$4
sed -i "s/${ori_str}/${rep_str}/g" `grep "$grep_word" -rl $4`  #数据源未目录或者文件即可测试:
[root@hadoop01 test]# chmod a+x /home/test/rep.sh
[root@hadoop01 test]# ./rep.sh abc 123 abc /home/test/

19.6 HDFS原理是什么,我们Linux中文件的原理是什么,区别是什么

hdfs原理:
使用多台廉价服务器来构建分布式文件存储系统,主要是一个master/slave架构,2.x版本可以实现多(推荐2)主多从来实现HA机制。同时该分布式文件系统也使用副本机制来最大限度保障文件的安全性能。
linxu原理:
在LINUX系统中有一个重要的概念:一切都是文件。 其实这是UNIX哲学的一个体现,而Linux是重写UNIX而来,所以这个概念也就传承了下来。在UNIX系统中,把一切资源都看作是文件,包括硬件设备。UNIX系统把每个硬件都看成是一个文件,通常称为设备文件,这样用户就可以用读写文件的方式实现对硬件的访问。
文件系统这一层相信大家都再熟悉不过了,目前大多Linux发行版本默认使用的文件系统一般是ext4,另外,新一代的btrfs也呼之欲出,不管什么样的文件系统,都是由一系列的mkfs.xxx命令来创建,如:mkfs.ext4 /dev/sdamkfs.btrfs /dev/sdb内核所支持的文件系统类型,可以通过内核目录树 fs 目录中的内容来查看。共同:
1、都是文件系统,都可以存储文件或者目录等。
2、都是以块的形式存储的。不同点:
1、块:linux的块直接对应于物理磁盘的block,而hdfs的块对应于linux中的文件。
2、块大小:linux的块大小要看磁盘类型,有1k、4k等。而hdfs中的块大小很轻松自行设置,默认hadoop1.x为64M,hadoop2.x为128M,hadoop3.x为256M,远大于linux的block大小。
3、文件:一个文件有多个block组成,而hdfs中一个文件底层还是由多个文件组成。
4、元数据:有操作系统上的inode记录其文件存储的数据区的block指针,而hdfs的由namenode来进行维护。
5、应用:linux主要用于应用服务和数据存储(不强调海量和分布式),而hdfs强调的是规模数据分布式的存储。

19.7 shell脚本编程:将select max(id) from table的值赋值到一个变量中;

vi /home/test/my.sh
#!/bin/bashmysql_var=`mysql --skip-column-names -uroot -proot -e "use test;select max(id) from stu"`
echo $mysql_var测试:
chmod a+x /home/test/my.sh
/home/test/my.sh  运行脚本

19.8 shell脚本编程:将mysql数据库中五个库中的五张表合并到一张表中,表的结构都相同;

vi /home/test/mm.sh
#!/bin/bash`mysql --skip-column-names -uroot -proot -e "insert into test.a1(id,name) select from ( select id,name from test1.a1 union all select id,name from test2.a1 union all select id,name from test3.a1 union all select id,name from test4.a1 union all select id,name from test5.a1)"`测试(未测试):
chmod a+x /home/test/mm.sh
/home/test/mm.sh  运行脚本

linux覆盖文件如何还原_大数据笔试真题集锦---第十九章Linux面试题相关推荐

  1. linux覆盖文件如何还原_大数据笔试真题集锦-——第十九章Linux面试题

    第十九章目录 第十九章 Linux 19.1 Linux中.如何调整文件最大打开数 修改linux的软硬件限制文件/etc/security/limits.conf. 在文件尾部添加如下代码: * s ...

  2. 大数据笔试真题集锦---第十一章:Sqoop面试题

    第十一章目录 第十一章 Sqoop sqoop本质是一款使用MR进行数据迁移的工具. 目前业界普遍用1.4.6版本,该版本与CDH集成. hive对外的一个统一存储格式的接口,使用hcatalog对接 ...

  3. map根据value值排序_凯哥带你从零学大数据系列之Java篇---第十九章:集合(Map+Collections)...

    温馨提示:如果想学扎实,一定要从头开始看凯哥的一系列文章(凯哥带你从零学大数据系列),千万不要从中间的某个部分开始看,知识前后是有很大关联,否则学习效果会打折扣. 系列文章第一篇是拥抱大数据:凯哥带你 ...

  4. bmp文件头_「正点原子FPGA连载」第十九章SD卡读BMP图片LCD显示

    1)摘自[正点原子]领航者 ZYNQ 之嵌入式开发指南 2)实验平台:正点原子领航者ZYNQ开发板 3)平台购买地址:https://item.taobao.com/item.htm?&id= ...

  5. oracle批量update数据_东方国信大数据面试真题

    东方国信 学长1 Hadoop工程师笔试题(金融事业部) 1)技术基础题(共十题,每题5分) (1)列举在Linux系统下可以在看系统各项性能的工具(区分CPU.内存.硬盘.网络等) (2)HDFS写 ...

  6. sql怎么实现取当前数据以及累计7天数据_年薪60万+大佬吐血整理字节跳动大数据面试真题...

    字节的面试难度一直很高,所以一直是我想攻克的目标,定下这个目标后就去准备收集了几十个字节实际面经,还包括面试前都需要做哪些准备.只能说是工欲善其事必先利其器,经过这些周全的准备,最终的面试还是很顺利的 ...

  7. 查看某个分区之前所有的数据_腾讯大数据面试真题汇总

    腾讯面试题 学长1 1)笔试部分 (1)有一表名t_sh_mtt_netdisk_log,从表名可以看出该表是什么业务的,是什么周期粒度的表. (2)怎么查看表结构,表创建语句?怎么查看表有哪些分区? ...

  8. java lambda表达式_凯哥带你从零学大数据系列之Java篇---第二十二章:Lambda表达式...

    温馨提示:如果想学扎实,一定要从头开始看凯哥的一系列文章(凯哥带你从零学大数据系列),千万不要从中间的某个部分开始看,知识前后是有很大关联,否则学习效果会打折扣. 系列文章第一篇是拥抱大数据:凯哥带你 ...

  9. 精选大数据面试真题10道(附答案详细解析)

    大数据笔面试系列文章分为两种类型:混合型(即一篇文章中会有多个框架的知识点-融会贯通):专项型(一篇文章针对某个框架进行深入解析-专项演练). 此篇文章为系列文章的第一篇(混合型) 第一题:大数据笔试 ...

最新文章

  1. 多行表头_多行表头数据汇总你怎么操作?手动复制粘贴?OUT!用VBA1分钟完成
  2. 赠票 | 深度强化学习的理论、算法与应用专题探索班
  3. atmega8 例程:T1定时器 快速PWM
  4. python TypeError: Expected int32, got list containing Tensors of type '_Message' instead.
  5. JAVA编程心得-JAVA实现CRC-CCITT(XMODEM)算法
  6. redis☞ python客户端
  7. js怎么把按钮往下移_Vue.js 实现计算器
  8. 使用函数自调用实现将局部变量转换成全局变量
  9. 出错提示:“Could not flush the DNS Resolver Cache: 执行期间,函数出了问题”的解决方法...
  10. python multiprocessing 批量下载图片+tqdm
  11. Vlookup函数多返回值处理
  12. 【证明】【一题多解】—— 负梯度方向的证明
  13. linux ssh升级回退,Linux-SSH升级及回退方案
  14. 光伏并网发电及低电压穿越技术
  15. 为什么数学叫“数学”?
  16. 以下哪些python数字是合法的_3 4j 是合法Python数字类型。
  17. 游戏常用算法:四种迷宫生成算法
  18. 游戏上云成标配 云服务器该怎么选?
  19. matlab绘制不同角度的抛体运动
  20. 校验输入的拼音是否符合声母韵母搭配规则(不是根据汉字生成拼音)

热门文章

  1. mui与java开发实例_mui开发的app例子,非常好资源,适合初学者
  2. ajax文件后台提交,有关文件上传 非ajax提交 得到后台数据问题
  3. (一)netty介绍
  4. postman发送Post请求
  5. python 倒排索引(Inverted Index)
  6. Linux 莱特币Litcoin节点搭建
  7. ddr4服务器内存和普通内存_买主板送DDR4内存!微星日联合大促开幕
  8. 灯泡亮度控制单片机_如何有效保护投影机灯泡 保护投影机灯泡方法【详解】...
  9. java反射 获取变量值_Java反射:如何获取变量的名称?
  10. mysql--MySQL数据库的简单认识