设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 手机 数据 公司
当前位置: 首页 > 服务器 > 安全 > 正文

京东大促备战思路2.0大揭秘(3)

发布时间:2021-01-08 21:48 所属栏目:53 来源:网络整理
导读:1.5. 处理能力确认 系统性能评估与验证的方法同样适用于本工作. 1.6. ?大促前夕的系统体检 就像运动员备战运动会一样,需要进行体检,以保证系统以优良的状态迎接大促.下表列出了重要的检查项: 2.??及时发现问题 为

1.5. 处理能力确认

系统性能评估与验证的方法同样适用于本工作.

1.6. ?大促前夕的系统体检

就像运动员备战运动会一样,需要进行体检,以保证系统以优良的状态迎接大促.下表列出了重要的检查项:

2.??及时发现问题

为一个互联网企业,业务发展和变更速度比较快,系统很难一直保持稳定,出现问题在所难免.问题发现的越早,才能越早介入处理;更进一步,如果能在问题发生之前就发现问题的趋势,并及时介入处理,就可能避免问题发生.

及时发现问题的主要手段是完善监控与报警体系,涵盖从业务,到应用再到硬件、网络全方面的监控.本文主要涉及应用级别的监控.

3.??快速决策和处理

系统运行时可能遇到各种各样的问题,如果有对应的应急预案,并演练到位,则可从容面对.当真的出现了紧急情况,最要紧并不是去寻找问题的根源,而是果断采取措施控制住影响.越早决策,影响就越小.

3.1. 应急预案

3.1.1. 风险分析

系统运行时可能遇到各种各样的问题,常见的有:

3.1.2. 预案重要元素

3.1.3. 常用预案和处理方法

3.2. 快速决策

  • 做好分工
  • 了解对业务的影响
  • 检查确认系统是否在正常工作;检查日志分析异常等信息
  • 检查机器负载;检查应用响应时长和吞吐量
  • 关注报警
  • 做好演练
  • 演练操作的熟练程度
  • 演练协调能力
  • 注意总结,某些问题可以直接做出决策

3.3. 快速执行

  • 提前打开配置界面,配置好;提前收集好各类信息
  • 提前建好上线任务
  • 进行培训和实际操作

4. 成熟稳定的团队

由于互联网业务发展变化较快,系统变更也比较频繁,不适合开发和运营分家的模式,而是自己建设的系统,自己负责运营.这样,不但能提高运营效率,大家又可以在运营过程中发现问题,体验问题带来的痛苦,所以会想办法改进设计,以避免问题发生.

这样的团队建设的系统会更易于运营,性能更加稳定,团队的设计能力也会显著提升,也就会趋于稳定和成熟,这样就形成了良性循环.

5. 流程和规范

备战大促,涉及到许多团队,需要大家通力合作,也就需要遵循一定的制定和流程规范,下表列举了其中一部分.

6. 总结

我们回顾一下备战的思路和方法,这是平时就要认真做好的:

  • 积极预防,遵循 PDCA 模型,在系统建设之初就注重非功能设计,注重如何方便日常运营,并持续改进系统
  • 提高发现问题的能力,能及早发现问题,甚至在问题发生前就介入处理
  • 提高问题决策和处理问题的速度,迅速控制住问题影响,并解决问题

如果面临大促,则有必要采取的措施有:

  • 用大促的业务量预估来对系统进行评估
  • 采取更加严格的检查措施,考虑进行跨系统的线上军演;大促前夕对系统进行全面的健康体检.
  • 大促来临时,执行严格的现场值班制度
  • 建立统一的大促组织,统一指挥

要能很好地执行以上方法,应该具备两个要素:

  • 日渐成熟的团队.开发团队即运营团队,团队在运营过程中发现问题,并通过系统设计解决问题,设计和运营能力一起提升.
  • 日趋完善的流程和规范,保障备战措施的顺利实施,促进团队进步.

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读