专家观察 | 肖力:“OpenStack政企专享云运维实践”(2)
另外我们要为几十个OpenStack项目服务,我们整个服务用公端驱动的,所有客户需求都是用公端体现的.我们还有日志系统,我们把云主机、物理机日志收集起来.现在我们还在做一件事情,做一些智能的预警,建立一个智能系统,通过日志分析,在故障没有发生之前做预测.以及我们还有一个项目管理系统. 这是我们的工单系统,我们日常就是靠工单系统运转,最早我们使用的一套开源工单系统,这套系统功能比较全一点,但是东西也比较笨重一点,后来我们开发了一套完全满足我们一套轻量级的工单系统,非常不错,界面是简陋一点. 这是我们的运维系统,基本上我们把它叫平台集成器,我们的研发帮我们做一个平台,底层有一个集成器.基本上我们目前运维就是高公端系统和自动化运维系统作为两个支撑点支撑的,在内部也运行比较顺畅. 我们有一个计划,我们使用了很多开源软件,我们也希望回馈一些东西,我们预计今年下半年或者明年年初,我们的公端系统和运维工具系统准备拿出来开源,和大家共享.因为我们觉得这些系统跟OpenStack结合的时候,我们还是有一些经验和心得的,希望能够分享出来. 另外运维我们还有一个非常大的特色,就是引入一些项目管理工具,比如我们拿到OpenStack项目会首先分成几个任务包,任务包可以再细分到天、人,每个人每天做什么,一些特别重要的项目,我们甚至会分解到小时,我们每天都有一个list,每天大家汇报信息,完成什么样,每天持续检查跟踪,这样可以保证我们对一个运维项目,对一个OpenStack项目,谱仪保质保量,而且在可控范围内能够把它做完. 这是我们运维团队的演进,最早的时候我们运维团队分为四组,一个是知识组,知识组分为两块,一个是24小时值班,一直看监控屏幕,还有一个是客服接电话的终端处理,还有一个组是现场组,这个组主要做一些物理服务器上架,还有操作系统安装,还有一个组叫网络安全组,做一些网络安全设备上架配置,还有网络服务的需求. 还有是系统组,系统组主要做操作系统以上,比如OpenStack部署,Ceph部署,客户系统的需求,可以做一些变更.这个划分可以满足我们业务需要,但是有一个问题,如果有项目来的时候,现场组工作量非常忙,但是项目结束以后,有一段时间可能没项目,这段时间他又相对比较清闲一点,工作量不饱和,而且还有一个问题,现场组这些人永远接触的都是硬件,网络组接触的都是网络的一些东西,然后我们做了团队的变革. 目前我们有三个组,一个是支持组,基本上还是做以前支持组的事情.还有是实施组,我们把现场组、网络组、系统组部署的活分到一个组里面,这样对于实施组来说有很好的学习机会,既可以做硬件部署,也可以做系统部署,也可以做OpenStack部署,也可以做终端处理.还有架构组,架构组主要做一些方案设计,方案实施,有时候需要见一些客户,对他来说也是很好的锻炼. 项目怎么实施呢?我们目前采用的是虚拟项目的机制,一般是架构组出一个人,实施组根据项目大小,人数不一样,有时候三到五人有时候更多,这个项目就一直归架构组处理.整个项目周期由一个人负责,这样的好处是项目他比较熟悉,客户一直接触他,有些问题也比较好处理,以及数据流量他都很清晰,能够保证项目不管是实施,以及实施后的项目服务,都可以保证. 文章来自微信公众号:云计算开源产业联盟 (编辑:ASP站长网) |