可用性

监控宝能够在每次监测时分别判断各个监测点是否可用,并通过所有监测点的可用性来判断监控项目的可用性。例如,监控一个网站:

n  一次监测中,只要网站在一个监测点可用,则认为网站是可用的。

n  一次监测中,只有网站在所有监测点都不可用时,才认为网站是不可用的,即发生故障。

可用

根据网站监控类型的不同,可用的具体含义如下:

n  HTTP/HTTPs监控:网站可以正常访问。

n  Ping监控:指定的服务器可以正常进行ICMP Ping检测。

n  DNS监控:DNS域名解析服务器可以正常解析指定域名。

n  TCP监控:通过TCP协议可以正常连接服务器指定端口。

n  FTP监控:FTP服务器可以正常连接。

n  UDP监控:通过UDP协议可以正常连接服务器指定端口。

n  SMTP监控:SMTP邮件服务器可以正常连接。

n  TraceRoute监控:服务器可以正常Trace。

可用率

可用率是一段时间内网站或服务器可用的时间占总时间的百分比。

例如,网站首页在一天内都可以正常访问,那么网站首页一天的可用率为100%。如果网站首页有9分钟无法访问,而一天共有1440分钟,那么网站首页的可用率为:

((1440 - 9) / 1440) * 100%,也就是99.37%。

平均可用率

平均可用率是指一段时间内所有监测点可用率的平均值。

例如,用户选择查看“西北地区&电信“的可用率统计,西北地区(电信)包括3个监测点,可用率分别为:西安电信99.86%、乌鲁木齐电信100%、兰州电信100%,则:

平均可用率=(99.86%+100%+100%)/3=99.95%

故障

根据网站监控类型的不同,故障的具体含义如下:

n  HTTP/HTTPs监控:所有监测点都无法正常访问网站。

n  Ping监控:所有监测点都出现数据包全部丢弃。

n  DNS监控:所有监测点都出现域名解析失败。

n  TCP监控:所有监测点都出现TCP连接失败。

n  FTP监控:所有监测点都出现FTP连接失败。

n  UDP监控:所有监测点都出现UDP连接失败。

n  SMTP监控:所有监测点都出现SMTP连接失败。

n  TraceRoute监控:所有监测点都出现Trace失败。

故障率

故障率是指一段时间监控项目故障的时间占总时间的百分比。

例如,监控项目的监测频率为2分钟,在10分钟内进行了5次监测,每次监测都有3个监测点(A、B、C)执行监测任务,具体监测结果见下表。


第一次监测

第二次监测

第三次检测

第四次监测

第五次监测

监测点A

不可用

可用

可用

可用

可用

监测点B

不可用

不可用

可用

可用

不可用

监测点C

不可用

可用

不可用

可用

可用

是否故障

故障时长

2分钟

0分钟

0分钟

0分钟

0分钟

注:每次监测结果为故障时,故障时长都加一个和监测频率相同的时长。

那么,故障率=故障时长/总时长,即(2+0+0+0+0)/10=20%。

响应时间

响应时间是指从用户对网站或服务器发送请求开始,一直到目标内容下载到用户端所用的时间。

对于HTTP/HTTPs监控,响应时间只针对网页本身,包括DNS解析、建立连接、服务器计算、下载内容所用的时间总和。但不包括网页中其它组件(比如CSS、Javascript脚本)的下载时间。

对于Ping监控,响应时间其实就是我们经常在命令行中用ping命令看到的time值,也就是我们常说的Ping值。

平均响应时间

每次监控中各个监测点响应时间的平均值。

最快响应时间

每次监控中各个监测点响应时间中最小的响应时间。

最慢响应时间

通过每次监控中各个监测点响应时间中最大的响应时间。

丢包率

在Ping监控中,丢失数据包数量占所发送数据包数量的百分比。如果不出现丢包情况监测点会发送3个数据包,如果中间有出现丢包情况监测点会发送4个数据包。

TraceRoute总跳数

数据包从监测点到目标主机所经过的总路由跳数。

TraceRoute无响应跳数

数据包从监测点到目标主机所经过的路由跳数中没有响应的跳数。

TraceRoute丢包跳数比

从监测点到目标主机出现丢包的跳数/总跳数。

无法连接服务器

指5秒内无法建立TCP连接,这个是我们自定义的。这与浏览器返回的“无法连接服务器”是两回事。

我们的监控很敏感,监测点请求一次,如果在五秒内无法连接到您的服务器获取信息,就会产生无法连接到服务器的记录。

请求超时

指我们监测点在30秒内没有完成请求,这跟浏览器的请求超时并不是一回事,通常我们认为用户不会等待这么长时间。

某一监测点出现问题可能是局部网络存在问题,因为我们监测点机房到您网站所在机房要走多级路由,路由走向很大程度由您的机房与我们机房的地理位置及机房网络的运营商来决定。如果从监测点机房到您网站所在机房所走多级路由中某一个路由不稳定或者有带宽瓶颈,那么访问就有可能出现问题。但此时我们的监测点到其他用户的机房有可能就是正常的。

服务器无返回数据

向服务器发送请求后无返回数据,可能是服务器处理请求时出现异常,建议您检查服务器Web应用程序。

响应内容超长

响应内容过大,监控宝不支持超过1MB的响应内容,建议使用HEAD方式。

DNS无法解析

可能是域名DNS服务商或者监测点ISP服务商的DNS服务器故障,可以在历史快照中找到用于解析的DNS服务器,并联系相关负责人。

数据包全部丢弃

单次ICMP Ping检测的丢包率为100%。

域名不存在

没有通过DNS服务器查询到对应的域名,建议联系域名服务商。

无解析记

没有给域名设置任何记录。