专家观察 | 魏新宇:“金融行业自动化运维的研究与落地”(2)
客户理想的自动化平台是:首先要有一个自动化运维门户(unifiedportal),理想状态是这个门户与客户的云门户统一对接.其次,当IT系统出现问题/需要变更的时候,自动/手动触发处理工单(这个工单系统符合ITIL流程,与行里现有流程和审计对接). 这个工单IT主管可以看到,审批以后、自动执行,把问题修复.比如:linux的根分区不够了,自动触发预运维平台的对应操作是自动扩容,但需要自动触发创建工单.工单到IT主管那,批准之后,自动扩容. 如果按照上一小节的“OS运维成熟度模型”来衡量该架构,上图这个架构不仅实现了自动化,也实现了集中监控.因此其等级至少为4+,接近于5级. 构建自动化运维平台中,红帽的左膀右臂分别是Ansible Tower和Satellite. Ansible Tower作为一款优秀的自动化运维工具,它有四大特点:
金融行业 satellite则在系统部署、订阅管理、软件管理、配置管理四方面帮助客户实现IT运维标准化. 红帽云管平台Cloudforms,可以与AnsibleTower和Satellite对接,实现云平台管理与运维统一. 那么,IT自动化运维平台架构如何落地? 首先我们先看自动化运维平台的架构:从下往上:IT环境、基础架构管理、数据展示层. IT环境层,指的是自动化运维平台需要纳管的对象.在一个复杂的数据中心中,运维绝不是仅仅针对一种操作系统,或者一种型号的服务器.而是整个数据中心,包括(但不限于): 1.系统层面:从Linux(物理机、虚拟机、云环境),Unix,到Windows. 2.虚拟化平台:VMware、Docker、Cloudstack、LXC、Openstack等. 3.商业化硬件:F5、ASA、Citrix、Eos以及各种服务器设备的管理. 4.系统应用层:Apache、Zabbix、Rabbitmq、SVN、GIT等. 5.商业化软件如:Openshift、Ceph、Gluster、Oracle等. 6.云平台:支持的云平台有AWS、Azure、Cloudflare、Red Hat CloudForms、Google、Linode、Digital Ocean等. 基础架构管理层 基础架构管理层的职责分为三大块:集中监控、运维自动化平台、内控平台. 1.集中监控平台包含平台(如虚拟化平台)监控和应用(如oracle数据库)监控. 2.运维自动化平台,它是基础架构管理层的核心组件.它需要完成四类操作:作业调度、自动巡检、批量发布、容灾管理.也就是说,运维自动化平台必须能够驱动IT环境层的七种对象. 3.内控平台,主要负责合规控制.它完成:合规管理、风险管理、用户管理、访问控制. 整体而言,在基础架构管理层中,运维自动化平台是最关键的,它是管理层的发动机.而集中监控平台和内控平台则是辅助自动化平台的.前者负责运维自动化的全生命周期管理,后者负责运维自动化平台的合规和安全. 服务管理层 服务管理层通常通过ITIL等架构理念,与客户的规章制度与业务流程匹配,需要做定制化开发.目前绝大多数金融行业用户都有流程,只是体现在纸面上.需要做的是将纸面上的流程IT工具化. 数据展示层: 主要是面向企业内部IT和非IT部门的内容用户.做统一的门户.过这个统一的平台,内部用户可以访问这个平台.通常情况,运维门户会与客户的云门户统一. 金融行业客户自动化运维平台实施步骤 任何一个大型平台,无论是混合云平台,还是自动化运维平台,它们的构建都不是一蹴而就的.都需要客户结合自身的情况,分步骤、分阶段走. 下面我们看一下自动化运维平台常见的几类工作,按照OS运维成熟度模型进行评估,六类工作都能实现自动化的话,IT成熟度可达到接近于5级的水平. (编辑:ASP站长网) |