这几个方面互为补充,逐渐让运维变得信手拈来.
1、数据库是一个非常专业的细分领域,传统的ITOM工具集成的监控功能往往太粗放,所以需要专业的数据库多维度监控,各项监控指标数据需要实时采集并存放,根据趋势进行告警.
就拿本案例来说,如果有对Exadata服务存活的监控,问题至少在故障发生前一星期就能得到预警,并及时处理.
2、日常运维场景化
太多的数据库意味着任何一个点的维护,都需要大量的时间消耗,因此需要集成、封装一些运维场景.比如:
- 自动化日常数据库的巡检
- 告警日志、跟踪日志的压缩和归档
- 比如定时作业的维护
- 容量趋势提醒及半自动扩容
- 以及一些自定义的场景(一些客户几百套Data Guard的日志修复)
- 历史数据自动归档
- …….
有了这些功能,你是不是可以省下好多时间钻研新技术,为企业核心技能的更新换代贡献自己的能量,而不需要整天想着逃离苦海了呢.
3、数据库实时性能分析
此功能意义很大,看下面两个场景:
- 比如一个电话打过来,小张,刚才小王说昨天下午2点22到2点30期间数据库很慢,他们自己重启了机器解决了,你分析下原因.这个时候你通常只能寄希望于dba_hist_sqlstat,但这个粒度太粗,结果就是往往没有结果;
- 时间不要离这么久,数据库发生大量TX锁资源了,帮忙查看下源头是谁.你一去看源头进程是3456,不过人家是idle进程,是一条select语句,显然不是它锁的.
如果有一个工具,能帮你实时记录数据库的这些信息,而且不用查询数据库,而是直接读取SGA,那这一些问题都能够分分钟解决,是不是很爽?
4、应用性能追溯
有些问题,明显是应用的问题,可是如果你不明确告诉他,是哪个应用模块,哪个用户干的,你几乎就说不清楚是应用的问题.
如果运维管理工具不仅仅能够帮你发现是哪个SQL语句导致,说出program,而且能告诉你是从哪个路径爬过来的,是由哪个jar包发起,那是不是一切就显而易见了呢.让背锅的日子见鬼去吧.
那么,存在这样的数据库运维管理工具么?
答案是yes.
作者介绍? 杨志洪
- 【DBAplus社群】联合发起人,新炬网络首席布道师.Oracle ACE、OCM、《Oracle核心技术》译者.
- 数据管理专家,拥有十余年电信、银行、保险等大型行业核心系统Oracle数据库运维支持经验,掌握ITIL运维体系,擅长端到端性能优化、复杂问题处理.现主要从事数据架构、高可用及容灾咨询服务
- 文章出处:DBAplus社群(微信公众号ID:dbaplus)
(编辑:ASP站长网)
|