设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 手机 数据 公司
当前位置: 首页 > 服务器 > 安全 > 正文

一个开发眼中的运维(2)

发布时间:2021-01-05 19:07 所属栏目:53 来源:网络整理
导读:1)包,所有线上的软件/脚本都是通过(rpm)包管理的. 2)文件,所有的变更“持久化”都是通过文件.程序的配置文件,sysctl,route,cron等凡是能用配置文件控制的一切. 3)进程,所有的进程都是用配置管理启动的,或者通过配置

1)包,所有线上的软件/脚本都是通过(rpm)包管理的.
2)文件,所有的变更“持久化”都是通过文件.程序的配置文件,sysctl,route,cron等凡是能用配置文件控制的一切.
3)进程,所有的进程都是用配置管理启动的,或者通过配置管理写文件到系统启动目录,例如rc3.d.

你能相到的一切,无论是配置keepalived,还是添加用户,都抽象为这三个.如果不能抽象为这三个,请再思考两个小时.
如果系统可以由这三者全部控制,而这三者又全部写入了配置管理,这意味着按照配置管理配置出来的系统就一定是对的.扩容,升级,机器的上线,下线从此该有多容易.而运维人员,可以通过配置管理,一览整个系统,通过持续改进的模板,配置更容易学习,不容易出错.

14. 监控

1)监控的正确性、业务响应时间也要同等关注的.
2)基础监控要全面,但不一定实时报警.如果业务不受影响,又何必半夜起来处理宕机呢?如果业务有问题,全面的监控会帮你发现问题的蛛丝马迹.

如果memcache偶尔响应慢,你怎么能想到是swap导致的呢?全面的监控可以帮你发现这一点.把业务逻辑抽象为资源,可以统一业务监控和基础监控.(监控如何算全面,参考8、9)

15. 运维技巧

1)重装操作系统,使用puppet重新配置,是系统恢复到正确状态的最佳途径.理论上,新装的机器使用puppet配置后一定是能用的,否则,就是puppet写的有问题.
2)区分无状态的机器和有状态的机器,尽量把状态集中,然后集中精力运维这些有状态的机器.
宁可通过网络把状态集中也要尽量让机器避免有状态,无状态的机器非常好运维.

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读