2017年全球云计算开源大会主题分享:《运维一体之平台一体化》
《2017年全球云计算开源大会主题分享:《运维一体之平台一体化》》要点: 3月底有幸参加了全球云计算开源大会,并作了一个关于《运维一体之平台一体化》的分享,现将PPT的内容整理成文. 运维一体化 之 平台一体化—-从标题看可以看到两个一体化,分别是运维一体化与平台一体化.运维一体化是数据中心的运营体系,包括:人员组织一体化、流程一体化、平台一体化三方面,其中平台一体化偏向于运维工具与自动化方面的建设.(平台一体化涉及的内容比较多,本文以30分钟来摘几个重点来分享) 一、转型:和目前大部份运维团队一样,我们的运维团队也打着“救火”、“背锅”、“低价值”等标签,团队的特点归纳下有四个特点: -被动救火式,以被动保障业务系统运行,日常计划性工作容易被打断、搁置; -问题驱动式,以系统可用性、可靠性、业务请求等问题驱动运维工作; -操作运维,重复性、操作类点主要工作量的运维模式; -经验式运维,由人工经验驱动的运维模式,尤其是一些经验丰富的老员工的离职在短期内会对运维质量带来一定的冲击. 针对上面四个特点我们提出了四个转型: -分别是从被动救火式向主动精细化转型,主动分析,主动优化,驱动开发,促进DEVOPS的落地; -从问题驱动向价值驱动转型,以业务体验、服务满意度、促进业务更好发展; -从操作运维向运维开发转型,通过为运维人员提供运维开发平台,降低运维开发门槛,快速落地一些紧迫的运维工具,降低操作性、重复性的运维工作; -从依靠经验向智能化驱动运维转型,结合数据分析、知识库、机器学习技术促进运维智能化. 在现有人力维持不变,运维质量要求不断提升的背景下,为实现上述面四个转型目标,我们认为首先要解放生产力,因为没有人什么都转型都实现不了.解决生产力当前最主要的手段还需靠自动化,所以下面再说说我们自动化方面遇到的3个困难: ?–如何更好:虽然运维体系比较完整,但工具主要以商业软件为主,以烟囱式建设,信息无法互联互通,无法实现1+1>2的效果; -如何更快:运维工具拿来较多,自主研发少,无法快速满足自身运维需求,还是存在较多人肉运维的工作; -如何更重要:运维职业危机,传统的运维操作为主的方式注定会成为历史,取而代之的是精细化运营,如何既解决职业危机,又能创造更大的价值,是难题; 针对上面提到的四个转型目标,以及自动化目前遇到的困难,我们制定了相关的技术及管理的改进方案:运维一体化. 二、一体化在讲一体化思路前,我先讲讲促进一体化思路形成的一些思路来源: -《架构即未来》这本书里提到的组织、流程、架构的三位一体和我们运维一体化很吻合; -腾讯蓝鲸、云霁科技在运维自动化方面的整体解决方案引导着我制定平台一体化的方案; -googlesre高逼格的运维运营模式,促进我在运维开发方面的解决思路形成; 如上图所示,我们的运维一体化的核心是组织、流程、工具三位一体,具体来讲是以CMDB为基础,结合运维统一门户、运维分析平台、云平台、监控平台、流程平台、操作平台、审计归档平台,构建运维工具一体化(即平台一体化),并在工具一体化的同时,结合流程一体化,最终构建组织、流程、工具三位一体的运营一体化的运营体系.运维一体化以运维向主动精细化运维、价值驱动、运维开发、智能化转型为目标,为实现上述目标首要的工作是需要解放运维生产力,通过“监管控”运维自动化提高工作效率,通过自主的开发平台实现敏捷的开发能力,通过运维分析实现运维智能化,辅助运维决策. 再重点讲讲分享的重点:平台一体化,平台一体化的思路是:6平台 +1门户+ 4原则. -6平台是:云平台、监控平台、归档审计平台、流程平台、操作平台、分析平台这6个平台分别对标我们身体的骨、眼、神经系统、循环系统、手、脑.其中监控平台、归档审计平台、流程平台、操作平台又组成了我们常规讲到的自动化中的“监、管、控”.这6个平台中每一个平台又组成相关技术体系,具体每个平台包括的体系内容及技术架构这里因时间问题不做深入解释. -1门户是:统一门户是运维可视化的关键,它集成了工具的可视化层,提供多维用户、多种展示形式、以运维场景驱动建设等作用. -4原则是:自主化,工具化、服务化、可视化,这4个原则后面会进一步介绍. 通过归纳这个6平台+1门户+4原则的平台一体化思路,并将这个思路推广到数据中心工具建设团队中,使我们能否快速达成共识,提高协作效率. 下面这张PPT是对平台一体化的进一步细化,概括了目前平台一体化中的主要内容,各位有兴趣可以花时间看看. 三、建设原则平台一体化规划重点解决各技术平台间的信息互联互通、统一展现和紧密联动,对于各个平台工具有着几个原则“服务化、可视化、自主化、工具化”,即: -自主化:构建运维开发平台降低运维工具开发门槛,促进平台工具开发更加自主可控,更加敏捷; -工具化:在运维团队中建设工具建设文化,促进运维开发文化建设; -服务化:拒绝推倒重建,整合好存量自动化工具,引入新的工具,实现工具间的互联互通,数据共享; -可视化:通过更加统一、清晰的可视化建设促进平台的效益的产生; 下面对这4个原则,结合我们目前工具建设阶段性的成效来做进一步的分享. 1、原则1:自主化自主化包括开发能力自主化与架构自主化. 1)开发能力的自主化,我们主要是通过建立运维开发平台,这个开发平台具有所见即所得的开发能力,PPT这几张工具界面是我们目前实现的脚本与可视化开发工具,它们具备这些特点: ?????? -所见即所得的脚本开发能力: 脚本开发环境(含环境、测试、部署,以及日志、权限、代码管理、脚本执行统计等一篮子解决方案); 标准组件化脚本可供调用,运维人员在开发过程中可以不写具体的脚本,采用组件的方式在可视化界面上组合多个现成的脚本为一个脚本. (编辑:ASP站长网) |