对于网站运维,感觉大家还是比较迷惘与不解,确实,这是一个新兴岗位;近来闲而无事,在此结合自已以往的一些经历,与大家先共同探讨一下“什么是门户网站运维”? 以下是自已的一些经验和感受请大家斧正,希望和大家一起探讨,共同进步。

一、什么是门户网站运维?

首先明确一下,全文所讲的”运维“是指:门户网站应用运维,与其它运维如网络、系统的区别还是蛮大的;然后我们再对大型网站与小型网站进行范围定义,此定义主要从运维复杂性角度考虑,如网站规范、知名度、服务器量级、pv量等考虑,其它因素不是重点;因此,我们先定义服务器规模大于1000台,pv每天至少上千万(至少国内排名前20),如sina、alibaba、sohu、baidu、网易等等。

其它小型网站可能没有真正意义上的运维工程师,这与网站规范不够和成本因素有关,更多的是集合网络、系统、开发工作于一身的“复合性人才”,就如本版有些同僚将公司的合同采购都纳入了运维职责范围,还有如IDC网络规划也纳入运维职责,这是网络工程师的工作,我们就不要抢人家饭碗了,但是,有件事非常重要一定需要明白:网站应用运维对其它关联工种必须非常了解熟悉:网络运维、系统运维、应用开发、内容;但这些非自已的本职工作,我在这里所讲的运维工程师就是指专职应用运维工程师。

我们再来说说一个般产品的“出生”流程:

1、首先公司BOSS层给出指导思想,PM定位市场需求(或copy成熟应用)进行调研、分析、最终给出详细设计

2、开发工程师将设计code实现出来、测试工程师对应用进行测试(同一产品事业部)

3、网络系统工程师根据产品设计的需求,如pv大小预估、服务器规模、应用架构等因素完成网络规划及设备上的调整(基本上对网络变动不大,除非大项目)、SA系统工程师负责产品服务器上架准备工作,服务器系统安装、网络、IP、通用工具集安装

4、好,到运维工程师出马了。

首先明确一点不是说前三步就与运维工作无关了,恰恰相反,前三步与运维关系很大:应用的前期架构设计、软/硬件资源评估申请采购、应用设计性能隐患及评估、IDC、服务性能安全调优、服务器系统级优化(与特定应用有关)等都需运维全程参与,并主导整个应用上线项目;运维工程师需要对上线的应用系统架构是否合理、是否具备可扩展性、及安全隐患等因素负责,并负责最后将产品(程序)、网络、系统三者进行拼接并最优化的组合在一起,最终完成产品上线提供用户使用,并周而复使:需求->开发(升级)->测试->上线(性能、安全问题等之前预估外的问题随之慢慢就全出来了)在这里提一点:网站开发模式与传统软件开发完全不一样,网站一天开发上线1~5个升级版本是家常便饭,用户体验为王嘛,如果某个线上问题像M$需要1年解决,用户早跑光了。

应用上线后,运维工作才刚开始,具体工作可能包括:升级版本上线工作、服务监控、应用状态统计、日常服务状态巡检、突发故障处理、服务日常变更调整、集群管理、服务性能评估优化、数据库管理优化(大于50台)、随着应用PV增减进行应用架构的伸缩、安全、运维开发工作:

a 、尽量将日常机械性手工工作通过工具实现(如服务监控、应用状态统计、服务上线等等),提高效率

b 、解决现实中服务存在的问题,如高可靠性、可扩展性问题等,

c、大规模集群管理工具的开发,如1万台机器如何在1分钟内完成密码修改、或运行指定任务?2000台服务器如何快速安装操作系统?各分布式IDC、存储集群中数BT级的数据如何快速的存储、共享、分析?等一系列挑战都需运维工程师的努力。

在此说明一下其它配合工种情况,在整个项目中,前端应用对于网络/系统工程师来说是黑匣子,同时开发工程师职责只是负责完成应用的功能性开发,并对应用本身性能、安全性等应用本身负责,它不负责或关心网络/系统架构方面事宜,当然软/硬件采购人员等事业部其它同事也不会关心这些问题,各司其职,但项目的核心是运维工程师~!所有其它部门的桥梁

上面说了很多,我想大家应该对运维有一些概念了,在此打个比方吧,如果我们是一辆高速行驶在高速公路上的汽车,那运维工程师就是司机兼维修工,这个司机不简单,有时需要在高速行驶过程中换轮胎、并根据道路情况换档位、当汽车速度越来越快,汽车本身不能满足高速度时对汽车性能调优或零件升级、高速行进中解决汽车故障及性能问题、时刻关注前方安全问题,并先知先觉的采取规避手段……这就是运维工作~!

最后说一下运维工程师的职责:“确保线上稳定”,看似简单,但实属不容易。运维工程师必须在诸多不利因素中进行权衡:新产品模式对现有架构及技术的冲击、产品高频度的升级带来的线上BUG隐患、运维自动化管理承度不高导致的人为失误、IT行业追求的高效率导致流程执行上的缺失、用户增涨带来的性能及架构上的压力、IT行业宽松的技术管理文化、创新风险、互联网安全性问题等因素,都会是网站稳定的大敌,运维工程师必须把控好这最后一关,需具体高度的责任感、原则性及协调能力,如果能做到各因素的最佳平衡,那就是一名优秀的运维工程师了。

另外在此聊点题外话,我在本版看到有很多人要sina、网易、sohu、baidu等聊自已的运维方面的经验,其实这对于它们有点免为其难:

a、各公司自已网络架构、规模、或多或少还算是公司的核心秘密,要保密;另外,对于大家所熟知的通用软件、架构,由于很多公司会根据自已实际业务需要,同时因为原版性能、安全性、已知bug、功能等原因,进行过二次开发(如apache,php,mysql...),操作系统内核也会根据不同业务类型进行定制的,如某些应用属于运算型、某些是高IO型、或大储存大内存型……根据这些特点进行内核优化定制,如sina就在memcache上进行过二次开发,搞出了一个memcache DB,具体做得如何我们不谈,但开源了,是值得称赞的,国内公司对于开源基本上是索取,没有贡献;另外,服务器也不是大家所熟知的型号,根据业务特点,大部份都是找DELL/HP/sun/ibm进行过定制;另外,在分布式储存方面都有自已解决方案,要不就是使用现成开源hadoop等解决方案,或自已开发。但90%都是借鉴google GFS的思想:分布式存储、计算、大表。

b、各公司业务方向不一样,会导致运维模式或方法都不一样,如alibaba和baidu运维肯定区别很大,因为他们业务模式决定了其架构、服务器量级、IDC分布、网络结构、通用技术都会不一样,主打新闻门户的sina与主打网游的盛大运维模式差异就非常大,甚至职责都不大一样;但有一点,通用技术及大致架构上都大同小异,大家不要太神化,更多的公司只是玩垒积木的游戏罢了,没什么技术含量。

c、如我上面所讲,目前门户网站运维还处于幼年时期理念和经验都比较零散,没有成熟的知识体系,我相信大家也讲不出所以然来(我现在也中抓破脑袋挤出这点字,呵呵),可能具体什么是运维,大家都要先思索一番,或压根没想过,真正讨论也只是运维工作的冰山一角,局限于具体技术细节,或某某著名网站大的框架,真正运维体系化东西没有,这也许是目前网上运维相关资料比较少的原故吧。

来自:http://www.betasoft.com.cn/btzsk/2013-03-19/2763.html

IT运维管理维护技巧:门户网站如何运维相关推荐

  1. 无人机综合管理系统/web端后台管理系统/设备管理/运维管理/维护管理/人员管理/维修保养/配件管理/保养管理/团队管理/axure后台管理原型/axure原型/web端后台管理原型/rp原型

    无人机综合管理系统/web端后台管理系统/设备管理/运维管理/维护管理/人员管理/维修保养/配件管理/保养管理/团队管理/axure后台管理原型/axure原型/web端后台管理原型/rp原型 axu ...

  2. 首次全面定义,《2022企业应用运维管理指标体系白皮书》发布

    近日,博睿数据联合艾瑞咨询共同发布了<2022企业应用运维管理指标体系白皮书>(以下简称<白皮书>).<白皮书>从企业IT运维的内涵以及在当前数字经济发展的大环境下 ...

  3. 运维思索:运维管理与运维自动化

    简述 各位小伙伴,近期技术文感觉发的有点多,不知是否给大家在工作中解决实际问题带来了一些灵感.为什么这么说呢?因为正是文章中涉及的细小知识点积少成多,让我从零碎繁忙的运维工作中得到了一定程度的解放.相 ...

  4. 解放运维的双手,谈自动化运维管理平台设计

    作者介绍 战学超,青航数据架构师.曾任职于NEC软件.海尔B2B平台巨商汇,负责企业数据平台构建.B2B电商平台数据管理与搭建.拥有丰富DBA.系统运维架构经验,擅长数据库.数据平台搭建.私有云部署. ...

  5. 数据中心综合布线可视化运维管理平台

    数据中心产业高速增长的趋势使各种规模数据中心的运维和管理工作迎来了新的挑战和机遇,这是一个巨大的市场,精准把握其发展趋势,可以让我们掌握发展的主动权.其中趋势之一就是整体的运维自动化正在全面的升级,那 ...

  6. Linux日常运维管理技巧

    Linux日常运维管理技巧 监控系统状态 1.w/uptime查看系统状态, 执行这个命令可得知目前登入系统的用户有那些人,以及他们正在执行的程序,以及当前负载的情况. 2.cat /proc/cpu ...

  7. 创建IT运维管理门户

    门户是新一代的人机界面. 人机界面技术随着计算机技术的发展而发展,从最初的大机时代的终端,到后来C/S架构采用的图形用户界面,到现在最流行的B/S架构的WEB浏览器界面.而现在随着技术的发展,人们希望 ...

  8. 无人机综合管理系统、设备管理、设备台账、零部件管理、故障维修、维护工单、飞控成员、飞行站点、飞行计划、飞行记录、运维管理、维护管理、人员管理、无人机管理、维修保养、配件管理、保养管理、团队管理

    无人机综合管理系统.设备管理.设备台账.零部件管理.故障维修.维护工单.飞控成员.飞行站点.飞行计划.飞行记录.运维管理.维护管理.人员管理.无人机管理.维修保养.配件管理.保养管理.团队管理. ax ...

  9. revit服务器维护,Revit软件在运维管理上的应用有哪些

    原标题:Revit软件在运维管理上的应用有哪些 Revit软件在运维管理上的应用有哪些?为改善建筑物耐久性能诊断数据的管理方式,改变传统以纸本为媒介的方式,透过信息化及数字化取代需要人工操作的部分,以 ...

最新文章

  1. 阿里云 Aliplayer高级功能介绍(二):缩略图
  2. 04: 用户授权及撤销 、 数据备份与恢复 、 MySQL管理工具
  3. 关于类与对象操作的细节与注意事项(c++细节篇三)
  4. (转)求单链表是否有环,环入口和环长
  5. [css] position跟margin collapse这些特性相互叠加后会怎么样?
  6. mysql 函数用还是不用_Mysql中日期和时间函数应用不用求人
  7. 办公自动化-幻灯片中插入图片与表格-pptx模块-0225
  8. 试列出种计算机组生产率的公式,农业机械化生产学思考题
  9. IBM “第8格(Debug)”开发者技术沙龙首站招募中,有胆你就来!
  10. oracle 的 dml,Oracle——DML
  11. 遥感数据集_最新高光谱遥感数据集
  12. 电磁仿真CST软件学习笔记:模型创建篇(更新中)
  13. IDEA部署web项目时,Artifact中war和war exploded的区别
  14. 张召忠:第四次工业革命来了》课堂笔记
  15. DML和DDL含义和区别
  16. 思科配置成网站服务器,思科路由器的配置NTP服务器的基本方法
  17. Linux服务器操作习惯培养
  18. 最近有股强烈的挫败感
  19. mariadb 分区表
  20. 如何分析个股基本面_如何从分析股票的基本面

热门文章

  1. vant UI 框架官网
  2. 今天的工作记录一下:关于centos关了防火墙却依然不能访问的问题
  3. 系统架构师第一部分——架构设计基础
  4. 键盘字母打字打出来是数字解决方法
  5. PPTP 619错误 The remote system is required to authenticate itself
  6. 2012第19周移动游戏推荐
  7. 新手骑友,如何利用山地车变速器,实现不同路况下的速度转换?
  8. java浮点数计算_Java之浮点数运算
  9. C++中i++和++i的联系与区别——学习笔记
  10. 【转载】也谈Flash mmorpg地图问题