应用概述

APPLICATION OVERVIEW

AIOps分析平台

运维团队每天会被大量无休止的事件所湮没,而且单点先进监控手段越多,风暴却会来的越猛烈,就像体检,检查的项目越多,报告里指标就越多,让人无所适从,需要医生从中总结出身体的疾病信息才能针对性进行治疗。AIOps分析中心通过合并、压缩事件来聚合生成告警事件,进而关联告警生成故障场景,让用户聚焦于关键点。


产品架构

SYSTEM ARCHITECTURE

产品优势

PRODUCT ADVANTAGES

数据分析

综合分析运维及运营状况,分析及预防故障

故障通知

多种对外接口,及时通知处理人员

快速排障

快速定位故障告警,及时了解故障原因


去重降噪

对于重复和相似告警可以自动压缩去重


集中管理

整合多种运维平台,故障处理统一入口


客户价值

CUSTOMER VALUE

01/

排除噪声感染,突出有效告警,提升故障发现速度。

01
02/

智能发现突发故障场景,减少人力投入。

02
03/

提供沙盒能力,供专家重现并设计故障场景 ,提升场景准确率。

03
04/

自动对故障场景进行分析并推荐故障根因,提升故障分析速度。

04

应用案例

APPLICATION CASES

某全国性大型银行

客户现状 :

1、业务系统运行在2万个虚拟节点上,管理的应用系统超过20个,子系统超过200个 ;

2、原运维系统无法适应云环境下的快速运维模式,在大数据量下无法快速发现及定位故障。


解决方案:

1、构建基于大数据及智能化的统一运维管理平台和日志集中管理平台;

2、同云环境管理平台相结合,建设适应云环境的智能监控运维平台,实现对云计算平台的监控及数据分析;

3、对超大规模应用数据及日志数据集中汇总,并实现数据快速查询及分析,满足规模化智能化的运维需求;

4、通过机器学习等智能化手段实现故障智能化的定位和自动处理等功能。


项目价值:

1、运维管理规模节点数超过2万台,云运维实现自动化;

2、总数据量达到100TB,日增数据量超过 15TB;

3、数据处理及查询响应时间可在秒级完成;

4、异常发现时间提前,误报率下降90%;

5、分钟级定位故障,运维管理人员减少。