互联网时代运维价值的重塑(2)
单服务器采购这一块涉及到的东西又很多,供应商管理、资源评估与规划、成本管理等.生产这一块可理解为把金属物体变成对业务可用的OS资源,服务器从出厂到上架到灌OS再到软环境的标准初始化等等,这一块在海量业务需求下对产能、资源供应效率的要求很高,传统的手动安装方式当然满足不了,于是IDC的同学要考虑批量快速生产的方案如kickstart,本人接触最高产能的部署系统是每小时部署5000台物理服务器OS,当然随着虚拟化云技术的应用,彻底改变了传统的基础架构资源生产和配置方式.调配这一块也是需要IDC同学去考虑的重点,如何管理业务需求,如何分配服务器资源,如何管理信息,服务器资源的调度等,站在更高的层面来说这一块就是如何灵活调度资源来满足业务需求,且能合理利用与控制成本,以下措施可以一试: ??? 维护这块是基本工作,其中涉及的处理流程、技术细节与硬件设备本身关系很大,本人接触到的dell/hp/ibm/Lenovo/华赛等各厂商的在用主流型号服务器达100多款,日常维护这块的工作量很大,作为IDC的同学当然也要从思路、平台等方面去优化,比如建立带外网络集中维护和管理、基于日志的自动分析和报障、事件与问题管理等等.资源回收与资源分配是同等重要的环节,宗旨是能做到有需求时放、无需求时收,这块要考虑的是如何对资源利用状态的监管,如何快速回收,弹性伸缩.以上只是大概说了服务器资源管理这条链的内部闭环流程.实际上在职能团队内部,类似的业务支撑流程很多很多.这些流程内部往往需要运维人员去考虑管理思路、实施技术、综合解决方案等多方面.外部闭环体现在多团队之间的工作协作上了,拿一个例子来说:某游戏产品需求在国内搭建一个大区,这个就需要运维多个团队来协作了,简化的流程如下:
流程的整合,需要看每个企业内部运维的职能团队、工作界面划分以及承载的业务逻辑,尤其对于全业务运维的团队,流程的制定很重要.一个好的流程,既要合理又要尽量简单,较大的运维团队要明确的一点是:保障一切正常运转的是规范的流程,而不是个人. 3.?? 自动化实施老话题了,对于业务量稍微上来、网络与服务器规模稍大一些的企业,都已经意识到这点的重要性.运维不做自动化,生活不会幸福.关键是怎么做,如何整体规划并大方向布局,见过很多运维自动化的实施方案,涉及运维工作中的各类场景.自动化实现方面大概有三个层次:
自动化的建设水平在行业内差异化还是明显的,如果处于运维自动化刚起步的阶段,那么本人的建议是:从整体上规划,基于ESB思想尽量让平台与业务逻辑解耦. 如上所示,我们先抛开基础架构侧的自动化不论,对于业务运维而言,整个工作面无非就是对业务运营环境的各种操作、配置,已经对业务应用程序的管理,简单来说就是OS层和应用层,要做自动化实施首先得有准确对称的数据,然后需要一个统一的管控平台,能并发的控制和操作远程大量主机,这解决了OS层面的操作问题,但需要管理应用层面的东西及需要与应用的研发人员确认相应的接口,对于开源组件而言一般不会有什么问题.因此如果是从零开始做自动化,个人认为CMDB、管控平台、业务管理工具这三部分是地基.在此基础之上,可以针对运维各类场景和业务逻辑去做相应的垂直功能系统,再上一层,可以使用流程引擎之类的组件来实现业务运维流程的纵向整合,最终实现运维场景化一键式作业. 运维自动化的宗旨是把运维人员的专业经验和技术知识转化为工具,让工具去做事情,让人去享受生活. 4.?? 标准交付(编辑:ASP站长网) |