报警知识库


连通性报警

<h1>报警描述</h1> <p>业务[XXX],虚拟机[X.X.X.X],用途[XXX]连通性状态报警,状态为断开</p> <h1>说明</h1> <p>当出现连通性报警时,说明时从监控系统到各个业务主机不通,需要跟踪业务主机是否临时重启,或是由于该业务的IP已经下架不再使用,或是调整网络导致不通。 对于已下架的业务可以考虑对该IP进行永久忽略或是将该IP从联网设备中删除。</p> <h1>监控对象</h1> <p>在监控系统中录入到联网设备中的所有IP地址。</p> <h1>监控方式</h1> <h2>通过ICMP协议监控</h2> <p>从监控系统ping各个联网设备的IP地址。命令为:</p> <pre><code>ping -w 2 -c 1 XXX.XXX.XXX.XXX</code></pre> <p>其中,XXX.XXX.XXX.XXX为IP地址。该命令执行一次对目标主机的ping操作,超时时间为2秒。 监控系统在该命令超时后,间隔一秒再ping一次,如果不通,间隔一秒再ping。如此循环5次。如果5次都不通,则会发出连通性报警。 连通性报警两分钟检测一次,恢复时间按照设备的监控时间间隔执行。</p> <h2>通过代理检测连通性</h2> <p>当无法通过ICMP协议检测连通性时,可通过监控代理检测其连通性。在目标设备安装监控代理后,监控代理每隔20秒会向监控系统发回心跳包。当心跳时间与系统当前时间相差较大时(2min~5min),会产生连通性报警。</p> <p>注意:系统同时会通过连通性和监控代理检测连通性。只有两个途径都不通时,才会产生报警。</p> <h1>规则</h1> <p>默认为报警级别。 可通过报警策略进行配置。</p>

页面列表

ITEM_HTML