当前位置:首页 新闻中心什么是运维?

什么是运维?

发布人:系统管理员系统管理员:2018-11-05

什么是运维呢?运维是一件对知识面要求很高的工作,它要求运维者不仅要懂得基本的系统与网络知识,还要对运维的业务系统有较深的理解,知道整套业务系统的工作模式与工作原理。这也是对运维人员学习能力的一种考验。

14.png

一听到故障描述,就可以大概知道问题的故障点所在。同时知道如何通过技术手段及清晰的逻辑方法去发现和解决问题。


运维是一件对自动化要求很高的工作,随着IT技术的不断发展,越来越多的方便运维的技术应运而生。


从互联网时代开始,业务系统的交付和迭代也变得越来越频繁,从每月的迭代一次,甚至到了每天迭代多次的场景。如果没有自动化的手段快速响应与处理,对用户的影响可想而知。自动化的主要目的个人认为主要是三个:


  效率提升:


初期自动化主要解决的是和日常运维例行工作相关的操作。


比如各种平台的资源分配&回收、统一配置管理、CI&CD(持续集成&发布)、操作系统的部署、系统空间的扩容与缩容、简单应用部署、文件分发等等,这些都是运维最基础的工作,也是自动化最容易实现和集中的领域。


个人觉得凡是那些偏日常和重复的工作都应该自动化,解放运维的生产力,提升运维效率,降低人为失误,让运维的同事可以有更多的精力去学习更多的技能,做更有价值的事情,无论互联网时代还是大数据时代,人才毕竟是最贵的。


目前自动化的解决方案都相对完善了很多,所以可以放心的去实践和应用。对于重要的领域和操作,一定要经过严谨的测试才能应用,否则自动化带来的灾难也是不可估量的。


  可靠可控:


可控对于运维人员来说是再重要不过的了,自身经验是,如果运维一套不可控的系统,无疑是攥着一颗不知道什么时候会爆炸的定时炸弹,时刻担心它会产生不可预知的后果。可控要细说我觉得大致可以分为稳定性可控、性能可控和安全可控。


  稳定性可控:


作为企业级的运维人员,我们要运维的系统不但数量多,而且网络架构复杂。包括的硬件更是多样,除了熟知的服务器、存储、网络设备、负载均衡设备等,可能还有很多是运维人员没有接触过的新玩意。


而这些硬件又承载了各种应用,组成了各类不同的系统供用户访问,复杂程度不言而喻。如何让这些设备在损坏的情况下也不影响业务,不影响运维人员陪女朋友看电影。做到心中有数,掌控硬件损坏会对系统有什么影响,需要多少时间来修复等等。


  性能可控:


合理的分配系统资源产生合理的性能对系统的稳定性起到了至关重要的作用。


一个系统慢与快并不是运维人员最担心的,而是时快时慢是最可怕的,因为那种状态是最不可控的状态,这样的系统是不可能承载企业核心或者重要的业务的。


最典型的应用场景就是云计算平台的资源分配。一旦平台资源被错误的分配,对业务的影响是不可估量的,拍错过程也是运维人员最头疼的。


  安全可控:


现在运维圈子流行的模块化管理、运维自动化、可视化甚至是基于大数据决策的运维,本质上都是希望达到运维可控的目标。安全是唯一一个贯穿运维全部过程的模块。


所以运维人员每日都会花费特别多的精力在系统的安全建设和防御上,比如防止哪些未授权行为,所有的操作必须通过堡垒机,关键操作必须通过审计等等。


IT运维安全方面的内容还是相当复杂的,比如应用交付可控,各种变更可控以及效率可控都是值得特别关注的。为什么我们熟悉的工作往往是最容易出问题的工作。


简单分析一下就是因为我们平常一直在周而复始的做一件事,产生了麻痹。同理,IT运维大部分都是一些重复性的操作与工作,但是又是必须的。


合理的通过自动化代替人工操作,可以非常有效的避免低级错误的发生。这对于企业级的复杂系统是至关重要的,可以明显提高可靠性,减轻运维人员繁琐的人工任务。


  降低人员依赖:


运维工作是个很有意思的工作,他不是靠人多堆出来的工种。运维工作对人员的技能要求还是比较高的,可谓是要精不要多,多培养精兵强将。


任何问题的处理都要避免靠堆人来解决,这种方式不一定会解决问题,但是一定会增加运维的成本。


运维是一件对精细化要求很高的工作,那么什么是精细化管理呢?引用一段官方解释:


“精细化管理是源于发达国家的一种企业管理理念,它是社会分工的精细化,以及服务质量的精细化对现代管理的必然要求,是建立在常规管理的基础上,并将常规管理引向深入的基本思想和管理模式,是一种以最大限度地减少管理所占用的资源和降低管理成本为主要目标的管理方式”。


现在的IT运维已经进入了精细化管理的时代,而不是以前的大锅饭年代了。分工明确,注重细节、注重过程、注重质量。


通过技术手段对全部的信息进行收集,管理员可以随时知道目前系统的运行状态。从而提高运维管理的整体水平和效果,实现了灵活的弹性扩容能力。


运维是一件对责任心要求很高的工作,各行各业都对责任心有很强的要求,运维也是如此。


因为不同系统的应用等级不同,影响范围也会不同。如果运维人员因为疏忽大意导致业务系统崩溃,所带来的影响可能是灾难性的。比如银行的结算系统、股票的交易系统等等。


我认为一个运维人员技术可以不是那么精深,做事可以不是那么敏捷,但是一定要有一颗较强的责任心,否则一切归零。


推荐阅读:

如何做好虚拟化运维?

未来的IT运维是什么样子?

一个开发眼中的运维

下一篇:无

上一篇:2019运维技能风向标