直击传统运维痛点,京东金融智能运维初探!(3)
随着时间间隔的增大,RNN 对于后面时间的节点相比前面时间节点的感知力将下降.解决这个问题需要用到 LongShort Term 网络(简称 LSTM),它通过刻意的设计来避免长期依赖问题.LSTM 在实践中默认可以记住长期的信息,而不需要付出很大代价. 对于某类故障引起的大量告警之间,存在着时间相关性.将历史派生告警作为输入,将根源告警类型作为输出.通过 LSTM 提取派生告警特征,建立告警相关性分析模型.这样就可以实时将符合特征的派生告警,划分到同一类根源告警中,帮助用户快速定位问题. 需要说明的是金融本身的业务特点决定了对第三方存在依赖性,因此告警本身的随机性较大,客观上导致学习样本的质量不高,需要长期的积累和修正才能达到比较好的效果,因此对于根源告警,如果有条件取到强关联关系,建议使用强关联分析,能达到事半功倍的效果. 结束语智能运维是目前运维领域被炒得最火的词汇之一,但是个人认为没有一个智能运维的产品是放之四海而皆准,智能运维需要在真实的环境中不断的磨合,才能达到我们预期的效果. 随着人工智能在运维领域的不断尝试与探索,未来在运维领域中的异常检测与智能报警及自动化容量规划与分配必将得到快速的发展,从而成为运维的核心竞争力.
(编辑:ASP站长网) |