运维工程师该干什么学些什么?[致菜鸟]

很多刚学linux运维的朋友,总是搞不懂,运维工程师工作中干些啥?学的这些东西有什么用?今日我特来总结总结,希望能帮助即将跨入该行的人形成一个整体的思路。下面红色字体代表所要掌握的LInux免费开源工具。

运维工程师干些什么

总结两句话

1、  保障业务长期稳定运行(如网站服务器、游戏服务器等等)。

2、  保障数据安全可靠(如用户名密码、游戏数据、博客文章、交易数据等等)。

由这两句话推演运维工程师要学些什么

一、保障业务长期稳定运行

出一点点差错,用户就要投诉了。

1、业务跑在什么上面?

网站服务器一般是apache,nginx,tomcat等。但是真正跑通流程还需要Mysql数据库来存储用户密码及其它。很多程序都要php的解析,所以LNMP、LAMP(即nginx、apache、mysql、php)环境部署是必须掌握的技能。

2、业务出了问题怎么及时知道?

这就需要监控软件来邮件或短信来通知你,常用的有zabbix,nagios等。报警发邮件,也得一个邮件程序呀,sendmail或postfix。

3、在家里收到报警,但服务器是内网IP,怎么也得解决问题吧?

在公司搭建open***或pptp或openswan,在家里通过×××拨入内网,24小时解决问题…唉,半夜爬起来解决问题也没工资。

 

二、保障数据安全可靠

出一点点差错,领导要找你喝茶了。

1、有时需要手动改数据库内容?

所以要会基本的Mysql数据库增删查改命令。

2、万一数据库服务器硬件坏了怎么办?

需要有个备库以备不时之需,所以需要Mysql主从复制。

3、  数据库要还原怎么办?

所以需要在crond中定期全备Mysql数据,以便还原使用。如果要还原到指定时间点,还要学会Mysql增量备份与恢复。

4、  如果是用户上传的图片或文件服务器坏了怎么办?

定时备份可能还不够,需要使用rsync加inotify来实时备份。以便任一时刻主服务器坏掉,也能保障所有图片有备份可以用来恢复。

5、小心***,要增加服务器安全性?

ssh轻易不能让外人访问,那么就设置只允许公司的IP或跳板机IP访问,这些都通过iptables来控制。

三、大性能

小公司总有一天会牛逼起来的,实在牛不起来咱也可以跳到大公司。

1、越来越多的用户来访问我们的网站,一台web服务器抗不住了怎么办?

那就需要多台web服务器来负担,但多台服务器之间怎么进行负载均衡呢,这就需要用到nginx反向代理或LVS+keepalived或haproxy+heartbeat了。

2、用户注册发表的文章与评论太多,一台数据库抗不住了怎么办?

数据库压力分为读和写,如果写抗不住,需要进行分表分库到多个服务器上。如果是读压力不够了,可以使用mysql-proxy读写分离,来分担读的压力。更简单方便的方法,把数据库里的内容放到内存上,这就用上memcache或redis了。

3、N多用户上传下载文件,磁盘抗不住了怎么办?

把多块磁盘做成raid,或者使用分布式存储文件系统如MFS,GlusterFS来提高磁盘的读写能力。

4、网站上好多图片,总有用户反应网站加载太慢,怎么办?

这时可以把网站上的图片通过squid或varnish缓存到网站前端,尽可能的增加访问速度,当然,最好是购买商业的CDN加速。

5、运营商是个大难题,他们之间的带宽好像很小,联通IP访问我电信网站怎么就这么慢呢?

这时可以使用bind自建一个DNS服务器,把网站的DNS记录指向自建DNS服务器上,配置好解析规则,以后联通IP解析到联通网站上,电信IP解析到电信网站上,体验就会好很多啦。

 

四、自动化

终极目标:跑死机器,闲死人。


1、  公司新买100台服务器,公司竟然就1个移动光驱,这装系统得到什么时候?

使用kickstart或cobbler来网络远程自动安装系统吧。

2、  每次装完机要优化很多内容,什么文件描述符、端口、软件安装啊,手动操作不累死去?

赶紧学会shell,将解放非常多的工作量。

3、系统装完后登陆要输入密码,这么多台啊?

使用expect吧,自动读取提示来输入密码,并执行命令。

4、要批量把新代码发布到线上服务器,怎么办?

使用saltstack或puppet或ansible吧,绝对爽歪歪。

五、其他

1、搭整套测试环境需要5台服务器,但公司穷的只有一台空闲服务器?

学会xen或kvm或docker吧,虚拟出多台服务器,就能解决资源问题了。特别是docker,强烈推荐,以后某个研发人员让你部署一套新环境,分分钟帮他解决。

2、研发人员的代码控制,权限控制,总要运维人员管呀?

svn或git,这个是肯定要有的。

结尾:

现在我们在回过头来思考,运维工程师平时干些啥呢?

1、  随时解决报警故障。

2、  业务程序更新。

3、  编写一些脚本,监控或完成其他可自动完成功能。

4、  运维架构完善,部署一些用起来更方便更可靠或性能更好的开源工具以及制定运维流程规范。

5、 打杂,如调交换机,装系统,部署新环境等。

转载于:https://blog.51cto.com/lybben/1727773

运维工程师该干什么学些什么相关推荐

  1. python运维是做什么的_Python运维工程师主要干什么?

    Python运维工程师主要干什么? 更新时间:2020年05月09日 作者:spoto 广义运维工程师的职责介绍 Python运维工程师主要干什么?其实无论是做什么运维,运维工程师最基本的职责都是负责 ...

  2. 运维开发学go还是python_运维工程师是要学python还是学go那?

    在我们的认知中,运维工程师就是一个背锅侠,那么咱们怎么样来避免做背锅侠那? 可能有人会告诉你,你需要去懂一门开发语言,其实在现价段,掌握一门开发语言已经成为高级运维工程师的必备计能.不会开发,你就不能 ...

  3. python职能-python运维工程师主要干什么

    很多人可能并没有听说过python运维工程师,只知道运维工程师或者是linux运维工程师这两个词.实际上python运维工程师这个岗位也是最近几年随云计算计算发展和广泛普及而火的,所以大家不知道pyt ...

  4. 运维学python用不上_运维工程师为什么要学python?

    现阶段,掌握一门开发语言已经成为高级运维工程师的必备计能,不会开发,你就不能充分理解你们系统的业务流程,你就不能帮助调试.优化开发人开发的程序, 开发人员有的时候很少关注性能的问题,这些问题就得运维人 ...

  5. 2020linux运维工程师前景,为什么学Linux发展前景好?linux运维工程师

    为什么学习Linux发展前景广阔?Linux系统应用广泛,现在科技极其发达,科技渗透着我们的日常生活.一些大型互联网企业的机房里,就有众多服务器提供服务的.这些服务器大多是Linux系统.或类Linu ...

  6. 月薪过万的运维工程师都要会干什么

    如果你想要进入运维领域这一行,首先你应该了解运维工程师是干什么的,除了对Linux下各种网络服务.应用系统.监控系统等进行自动化脚本开发的工作,并根据项目对系统进行性能优化,运维工程师还应该掌握哪些升 ...

  7. linux运维工程师到底是做什么的?

    linux运维工程师到底是做什么的? 如果你想要进入运维管理领域这一行,首先你应该了解linux运维工程师是干什么的.他主要是对Linux下各种网络服务.应用系统.监控系统等进行自动化脚本开发的工作, ...

  8. Linux运维工程师是做什么的?运维发展前景到底怎么样?

    Linux运维工程师到底是做什么的? 如果你想要进入运维管理领域这一行,首先你应该了解linux运维工程师是干什么的.他主要是对Linux下各种网络服务.应用系统.监控系统等进行自动化脚本开发的工作, ...

  9. Linux运维工程师有“钱途”吗?

    愿意往IT互联网方面发展的同学看到最多的一个职业就是Linux运维工程师.那么这个Linux运维工程师是干啥的呢?如果你想要进入运维领域这一行,首先你应该了解linux运维工程师是干什么的.Linux ...

最新文章

  1. Ubuntu 16.04 安装 Docker - Dependency failed for Docker Application Container
  2. NAT双出口的热备份
  3. MongoDB时间类型
  4. rn+与android+交互,React native 与Android原生交互方式(一)
  5. java正则表达式验证密码_java密码验证正则表达式校验
  6. java call oracle procudure setBoolean问题PLS-00306: wrong number or types of arguments in call to
  7. 向量归一化的matlab程序,向量X的归一化及其Matlab简单示例
  8. 废弃fastjson!大型项目迁移Gson保姆级实战
  9. for 循环中实现多个点击事件
  10. win10系统下JDK环境变量配置失败的原因
  11. Chartboost大中华区开发者关系经理刘欣允:如何设计,以增加游戏内收入
  12. Circular Coloring
  13. 【其他笔记】 双屏显示分辨率低下、屏幕闪烁、暗沉等问题。
  14. Java两个线程交替打印奇偶数(两种方法对比)
  15. Linux驱动开发之常见error汇总
  16. matlab仿真高尔顿正态分布源码,中心极限定理:从高尔顿板到麦克斯韦分布
  17. Multisim14创建LM386教程(含所需文件)
  18. 阿里云短信 签名 模板编写
  19. LittleFS移植实践
  20. 2021-7 论文阅读 [PatchScope: Memory Object Centric Patch Diffing]

热门文章

  1. An error occurred during the file system check
  2. Profiler 使用说明
  3. 演练:开发和使用自定义服务器控件
  4. 序列两两比对算法_【陪你学生信】八、序列两两比对
  5. Xamarin Essentials教程数据处理传输数据
  6. Xamarin.Forms使用Slider注意问题
  7. python的序列包括什么_一文读懂什么是序列 (sequence)
  8. html十秒倒计时跳转,javascript实现倒计时跳转页面
  9. 长得类似铁甲小宝的机器人_铁甲小宝:小时候只顾看机器人忽略重点,长大后再看:是我太天真...
  10. python3读取excel文件(xls/xlsx)