弹性云服务器支持的操作系统监控指标(安装Agent)_使用CES监控ECS_用户指南_弹性云服务器ECS

复制链接到剪贴板

通过在弹性云服务器安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。本节定义了弹性云服务器上报云监控的操作系统监控指标。指标采集周期是1分钟。

操作系统监控目前支持的监控指标有:CPU相关监控项、CPU负载类相关监控项、内存相关监控项、磁盘相关监控项、磁盘I/O相关监控项、文件系统类相关监控项、网卡类相关监控项、NTP类相关监控项、TCP连接数类相关监控、GPU相关监控项、NPU相关监控项、DAVP相关监控项。

安装Agent后,对于不同的操作系统、不同的弹性云服务器类型,您可以查看不同类型的操作系统监控指标。

您可以通过管理控制台直观地,也可以为监控指标,并开启消息通知服务。当某个监控指标达到告警条件时,系统会通过短信、邮件、HTTP、HTTPS等多种方式给您发送告警通知,便于您及时掌握弹性云服务器的运行状态。

已完成Agent插件的安装。具体操作,请参见。

监控周期(原始指标)

该指标用于统计测量对象当前CPU使用率。

该指标用于统计测量对象当前CPU空闲时间占比。

该指标用于统计测量对象当前用户空间占用CPU使用率。

该指标用于统计测量对象当前内核空间占用CPU使用率。

该指标用于统计测量对象其他占用CPU使用率。

该指标用于统计测量对象当前Nice进程CPU使用率。

该指标用于统计测量对象当前iowait状态占用CPU的比率。

该指标用于统计测量对象当前CPU处理中断用时占用CPU时间的比率。

该指标用于统计测量对象当前CPU处理软中断时间占用CPU时间的比率。

监控周期(原始指标)

该指标用于统计测量对象过去1分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load1/逻辑CPU个数得到。用户可以通过top命令查看load1值。

该指标用于统计测量对象过去5分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load5/逻辑CPU个数得到。用户可以通过top命令查看load5值。

该指标用于统计测量对象过去15分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load15/逻辑CPU个数得到。用户可以通过top命令查看load15值。

Windows系统暂不支持CPU负载指标。

监控周期(原始指标)

该指标用于统计测量对象的可用内存。

该指标用于统计测量对象的内存使用率。

该指标用于统计测量对象的空闲内存量。

该指标用于统计测量对象的Buffers内存量。

该指标用于统计测量对象Cache内存量。

该指标用于统计测量对象的所有进程使用的句柄总和。

/var/lib/docker;/mnt/paas/kubernetes;/var/lib/mesos 弹性的操作监控指标Ag

表4 磁盘相关监控指标说明

指标

监控周期(原始指标)

该指标用于统计测量对象磁盘的剩余存储空间。

该指标用于统计测量对象磁盘存储总量。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象磁盘的已用存储空间。

该指标用于统计测量对象磁盘使用率,以百分比为单位。计算方式为: 磁盘已用存储量/磁盘存储总量。

监控周期(原始指标)

该指标用于统计每秒从测量对象读出数据量。

通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化得出磁盘读速率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计每秒从测量对象读取数据的请求次数。

通过计算采集周期内/proc/diskstats中对应设备第四列数据的变化得出磁盘读操作速率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计每秒写到测量对象的数据量。

通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化得出磁盘写速率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计每秒向测量对象写数据的请求次数。

通过计算采集周期内/proc/diskstats中对应设备第八列数据的变化得出磁盘写操作速率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象磁盘读操作平均耗时。

通过计算采集周期内/proc/diskstats中对应设备第七列数据的变化得出磁盘读操作平均耗时。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象磁盘写操作平均耗时。

通过计算采集周期内/proc/diskstats中对应设备第十一列数据的变化得出磁盘写操作平均耗时。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象磁盘I/O使用率。

通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化得出磁盘I/O使用率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标反映指定时间段内磁盘的繁忙程度,可用于评估磁盘I/O性能,指标值越大代表磁盘越繁忙,I/O性能越差。

通过计算采集周期内/proc/diskstats中对应设备第十四列数据的变化与指标采集周期时间相除得出指标的值。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计指定时间段内,平均每个写I/O操作传输的字节数。

通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化与第八列数据的变化相除得出磁盘平均写操作大小。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计指定时间段内,平均每个读I/O操作传输的字节数。

通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化与第四列数据的变化相除得出磁盘平均读操作大小。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计指定时间段内,平均每个读或写I/O的操作时长。

通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化与第四列数据和第八列数据和的变化相除得出磁盘平均I/O时长。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象物理磁盘使用率,以百分比为单位。计算方式为: 所有已挂载磁盘分区已用存储量/磁盘存储总量。

监控周期(原始指标)

(Agent) 文件系统读写状态

该指标用于统计测量对象挂载文件系统的读写状态。状态分为:可读写(0)/只读(1)。

采集方式(Linux):通过读取/proc/mounts中第四列文件系统挂载参数获得。

该指标用于统计测量对象当前磁盘的inode空间量。

采集方式(Linux):执行df -i命令,查看Inodes列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象当前磁盘已使用的inode空间量。

采集方式(Linux):执行df -i命令,查看IUsed列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象当前磁盘已使用的inode占比。

采集方式(Linux):执行df -i命令,查看IUse%列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

Windows系统暂不支持文件系统类监控指标。

监控周期(原始指标)

该指标用于统计测量对象网卡每秒发送的比特数。

该指标用于统计测量对象网卡每秒接收的比特数。

该指标用于统计测量对象网卡每秒接收的数据包数。

该指标用于统计测量对象网卡每秒发送的数据包数。

该指标用于统计测量对象网卡每秒接收的错误数据包数量占所接收的数据包的比率。

该指标用于统计测量对象网卡每秒发送的错误数据包数量占所发送的数据包的比率。

该指标用于统计测量对象网卡每秒接收并已丢弃的数据包数量占所接收的数据包的比率

该指标用于统计测量对象网卡每秒发送并已丢弃的数据包数量占所发送的数据包的比率。

监控周期(原始指标)

该指标用于统计测量对象当前NTP偏移量。

监控周期(原始指标)

该指标用于统计测量对象所有状态的TCP连接数总和。

该指标用于统计测量对象处于ESTABLISHED状态的TCP连接数量。

该指标用于统计测量对象处于请求连接状态的TCP连接数量。

该指标用于统计测量对象服务器端收到的请求连接的TCP数量。

该指标用于统计测量对象客户端主动关闭且没有收到服务端ACK的TCP连接数量。

该指标用于统计测量对象处于FIN_WAIT2状态的TCP连接数量。

该指标用于统计测量对象处于TIME_WAIT状态的TCP连接数量。

该指标用于统计测量对象关闭的或未打开的TCP连接数量。

该指标用于统计测量对象处于CLOSE_WAIT状态的TCP连接数量。

该指标用于统计测量对象被动关闭等待ACK报文的TCP连接数量。

该指标用于统计测量对象处于LISTEN状态的TCP连接数量。

该指标用于统计测量对象处于服务端和客户端同时主动关闭状态的TCP连接数量。

该指标用于统计测量对象重新发送的报文数与总发送的报文数之间的比值。

监控周期(原始指标)

该指标用于统计虚拟机上GPU健康状态,是一个综合指标。

该指标用于统计该GPU的编码能力使用率。

该指标用于统计该GPU的解码能力使用率。

该指标用于统计该GPU重置以来可纠正的ECC错误数量,每次重置后归0。

(Agent) 不可纠正ECC错误数量

该指标用于统计该GPU重置以来不可纠正的ECC错误数量,每次重置后归0。

(Agent) 累计可纠正ECC错误数量

该指标用于统计该GPU累计的可纠正ECC错误数量。

(Agent) 累计不可纠正ECC错误数量

该指标用于统计该GPU累计的不可纠正ECC错误数量。

该指标用于统计该GPU当前卡隔离的单比特页的数量。

该指标用于统计该GPU当前卡隔离的双比特页的数量。

该指标用于统计该GPU的性能状态。

该指标用于统计该GPU的显存使用率。

该指标用于统计该GPU的算力使用率。

该指标用于统计该GPU的显存剩余量。

该指标用于统计该GPU的显卡(着色器)时钟频率。

该指标用于统计该GPU的内存时钟频率。

该指标用于统计该GPU的功率。

该指标用于统计该GPU的PCI入方向流量。

(Agent) GPU流式处理器时钟频率

该指标用于统计该GPU的流式处理器时钟频率。

该指标用于统计该GPU的温度。

该指标用于统计该GPU的PCI出方向带宽。

该指标用于统计该GPU的显存使用量。

该指标用于统计该GPU的视频(包含编解码)时钟频率。

监控周期(原始指标)

该指标用于统计虚拟机上NPU卡的健康状态,是一个综合指标。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的显存使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的AI核心使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的AI CPU的使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的控制CPU的使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的显存的带宽使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的显存的时钟频率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU AI核心的时钟频率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU 显存的使用量。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU卡当前的单比特页错误的数量。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU卡当前的多比特页错误的数量。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU卡的功率。其中,310卡仅支持显示额定功率,其余卡显示实际功率

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU卡当前的温度

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

Windows系统暂不支持NPU类监控指标。

监控周期(原始指标)

该指标用于统计虚拟机上DAVP卡的健康状态,是一个综合指标。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的显存使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的显存使用量

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的AI核心的使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的vdsp核心使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

(Agent) DAVP卡编码核心使用率

该指标用于统计该DAVP的编码核心使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

(Agent) DAVP卡解码核心使用率

该指标用于统计该DAVP卡的解码核心使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的系统模块温度。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

Windows系统暂不支持DAVP类监控指标。

该取值可通过云监控服务的“”获取。

云服务器磁盘的挂载点。

该取值可通过云监控服务的“”获取。

GPU类型云服务器中显卡。

该取值可通过云监控服务的“”获取。

NPU类型云服务器中显卡。

该取值可通过云监控服务的“”获取。

DAVP类型云服务器,其中搭载了DaoCloud DAVP1视频加速卡。

该取值可通过云监控服务的“”获取。

在使用文档中是否遇到以下问题

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

提供免费备案服务

云业务全流程支持

华为云微信小程序

华为云微信小程序

增值电信业务经营许可证:B1.B2-20200593 | 域名注册服务机构许可:黔D3-20230001 | 代理域名注册服务机构:新网、西数


本文地址: https://www.earthnavs.com/jishuwz/500ca69ebdeed0827c1c.html
全局中部横幅
百度一下

全球领先的中文搜索引擎、致力于让网民更便捷地获取信息,找到所求。百度超过千亿的中文网页数据库,可以瞬间找到相关的搜索结果。

360游戏中心,我创造你快乐

360游戏中心是超好玩的的免费安全游戏平台,为亿万360玩家提供各种新鲜好玩的免费游戏及超值游戏礼包福利-360游戏中心,我创造你快乐!

技术导航

国内首屈一指的技术教程活动导航分类平台,站点已累计收录数千网站,累计为中国网民提供多达数亿的访问点击,满足用户随时查阅最全面最权威的文章资讯教程

BBC
BBC

VisitBBCfortrustedreportingonthelatestworldandUSnews,sports,business,climate,innovation,cultureandmuchmore.

清博智能

北京清博智能科技有限公司成立于2014年,先后拥有清博指数、清博舆情、新媒体管理平台、元娲虚拟人、先问大模型五大产品,并提供舆情分析报告、新媒体管理、虚拟人、大模型定制、品牌营销、元宇宙六大优质服务,通过将AI技术赋予感知、分析和决策的能力,从而为客户提供更智能、更高效、更优质的服务。

综艺频道

爱奇艺综艺频道最新热播综艺节目,涵盖内地综艺、韩国综艺、选秀、真人秀等多种类型,提供免费、VIP等观看方式,高清流畅在线观看。

【汽车论坛】汽车社区

汽车之家论坛,全球最大汽车论坛,助力全球车友交流提车经历,用车感受,车友会活动,维修保养经验,自驾游等,更有媳妇当车模,美人生活秀,论坛红人馆等专题,精彩汽车内容尽在汽车之家

长江网

长江网(www.cjn.cn)成立于2002年8月,是国家重点地方新闻网,是武汉市唯一拥有国家Ⅰ类资质的新闻网,是武汉市唯一上榜《互联网新闻信息稿源单位名单》(白名单)的网站,拥有《互联网新闻信息服务许可证》、《网络文化经营许可证》、《互联网出版许可证》、《信息网络传播视听节目许可证》、《广播电影电视节目制作经营许可证》、《增值电信业务经营许可证》、《短消息类服务接入代码使用证书(电信网码号资源)》等权威资质。作为互联网舆论主阵地,目前,长江网全媒体矩阵包括:长江网(小程序、APP、PC端、WAP端)、长江时评;长江网人民号、新华号,长江网微信、微博、抖音号、头条号、视频号、B站等。同时,承担“学习强国”武汉学习平台、“武汉发布”平台、武汉市级新闻发布会、武汉城市留言板、武汉企业直通车、武汉市网络人士实践创新基地、“武汉人大”微信公众号、“武汉组工”微信公众号等党政平台运维工作。长江日报报业集团依托长江网成立武汉都市圈新闻中心,助力武汉发挥“一主引领”作用,为推进都市圈同城化发展提供强大舆论支持。