联系我们

加入社区

微信扫码
加入官方交流群

立即体验

在线开通,按量计费,真正的云服务!

立即开始

选择观测云版本

代码托管平台

Intelligent Inspection

智能巡检

观测云智能巡检基于观测数据、巡检规则和 DataFlux Func 自动分析多云、基础设施、云原生、前端和微服务中的趋势性风险,帮助 SRE、运维和平台团队在故障发生前发现容量、性能、成本和业务异常。

联系我们

智能巡检解决什么问题

把常见稳定性风险沉淀为自动巡检,提前发现问题

很多故障在发生前已经有趋势信号,例如容量逼近、资源闲置、错误类型增加、数据延迟或成本异常。智能巡检把这些经验沉淀为规则和脚本,自动分析观测云中的指标、日志、链路、云资源和业务数据,帮助团队提前处理风险。

多云和基础设施风险,先用官方巡检库自动发现
智能巡检可同步多云资产、云监控、云日志和云账单数据,围绕云资源、主机、容器、容量、成本和关键资源状态进行自动检查。团队可以发现资源饱和、关键资源异常、闲置主机、Spot 实例风险和云账单异常,减少人工巡检成本。
多云和基础设施风险,先用官方巡检库自动发现
应用和业务异常,也可以变成自动巡检任务
应用和业务异常,也可以变成自动巡检任务
智能巡检支持前端新错误类型发现、性能诊断、微服务根因分析和数据 Pipeline 完整性检查。对于研发和 SRE 团队,它可以把常见排障经验前置到巡检阶段,减少故障发生后才开始收集证据的被动局面。
官方规则不够?用 Func 写团队自己的业务巡检
团队可以基于官方巡检脚本做定制,也可以基于观测云数据开发业务级巡检,例如订单异常、数据延迟、接口质量、交易漏单等场景。结合时序处理函数和算法能力,智能巡检可以承载团队自己的稳定性经验。
官方规则不够?用 Func 写团队自己的业务巡检

常见问题

什么是智能巡检?

智能巡检是基于观测数据和巡检规则自动分析系统风险的能力,用于提前发现容量、性能、成本、数据质量和业务异常等问题。

智能巡检和监控告警有什么区别?

监控告警通常在指标或事件达到条件时触发通知;智能巡检更偏向定期或按规则主动分析趋势、隐患和复合型问题,帮助团队在故障发生前发现风险。

智能巡检可以自定义吗?

可以。团队可以基于官方巡检脚本做定制,也可以使用 DataFlux Func 和观测云数据开发业务级巡检规则。

智能巡检适合哪些团队?

它适合 SRE、运维、平台工程、云基础设施和业务技术团队,尤其适合希望把人工巡检经验自动化、标准化的组织。

相关阅读

想看智能巡检如何落到你的业务系统?

预约演示