弹性云服务器支持的操作系统监控指标(安装Agent)_使用CES监控ECS_用户指南_弹性云服务器ECS

复制链接到剪贴板

通过在弹性云服务器安装Agent插件,为用户提供服务器的系统级、主动式、细颗粒度监控服务。本节定义了弹性云服务器上报云监控的操作系统监控指标。指标采集周期是1分钟。

操作系统监控目前支持的监控指标有:CPU相关监控项、CPU负载类相关监控项、内存相关监控项、磁盘相关监控项、磁盘I/O相关监控项、文件系统类相关监控项、网卡类相关监控项、NTP类相关监控项、TCP连接数类相关监控、GPU相关监控项、NPU相关监控项、DAVP相关监控项。

安装Agent后,对于不同的操作系统、不同的弹性云服务器类型,您可以查看不同类型的操作系统监控指标。

您可以通过管理控制台直观地,也可以为监控指标,并开启消息通知服务。当某个监控指标达到告警条件时,系统会通过短信、邮件、HTTP、https等多种方式给您发送告警通知,便于您及时掌握弹性云服务器的运行状态。

已完成Agent插件的安装。具体操作,请参见。

监控周期(原始指标)

该指标用于统计测量对象当前CPU使用率。

该指标用于统计测量对象当前CPU空闲时间占比。

该指标用于统计测量对象当前用户空间占用CPU使用率。

该指标用于统计测量对象当前内核空间占用CPU使用率。

该指标用于统计测量对象其他占用CPU使用率。

该指标用于统计测量对象当前Nice进程CPU使用率。

该指标用于统计测量对象当前iowait状态占用CPU的比率。

该指标用于统计测量对象当前CPU处理中断用时占用CPU时间的比率。

该指标用于统计测量对象当前CPU处理软中断时间占用CPU时间的比率。

监控周期(原始指标)

该指标用于统计测量对象过去1分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load1/逻辑CPU个数得到。用户可以通过top命令查看load1值。

该指标用于统计测量对象过去5分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load5/逻辑CPU个数得到。用户可以通过top命令查看load5值。

该指标用于统计测量对象过去15分钟的CPU平均负载。

采集方式(Linux):通过/proc/loadavg中load15/逻辑CPU个数得到。用户可以通过top命令查看load15值。

Windows系统暂不支持CPU负载指标。

监控周期(原始指标)

该指标用于统计测量对象的可用内存。

该指标用于统计测量对象的内存使用率。

该指标用于统计测量对象的空闲内存量。

该指标用于统计测量对象的Buffers内存量。

该指标用于统计测量对象Cache内存量。

该指标用于统计测量对象的所有进程使用的句柄总和。

/var/lib/docker;/mnt/paas/kubernetes;/var/lib/mesos 弹性的操作监控指标Ag

表4 磁盘相关监控指标说明

指标

监控周期(原始指标)

该指标用于统计测量对象磁盘的剩余存储空间。

该指标用于统计测量对象磁盘存储总量。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象磁盘的已用存储空间。

该指标用于统计测量对象磁盘使用率,以百分比为单位。计算方式为: 磁盘已用存储量/磁盘存储总量。

监控周期(原始指标)

该指标用于统计每秒从测量对象读出数据量。

通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化得出磁盘读速率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计每秒从测量对象读取数据的请求次数。

通过计算采集周期内/proc/diskstats中对应设备第四列数据的变化得出磁盘读操作速率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计每秒写到测量对象的数据量。

通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化得出磁盘写速率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计每秒向测量对象写数据的请求次数。

通过计算采集周期内/proc/diskstats中对应设备第八列数据的变化得出磁盘写操作速率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象磁盘读操作平均耗时。

通过计算采集周期内/proc/diskstats中对应设备第七列数据的变化得出磁盘读操作平均耗时。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象磁盘写操作平均耗时。

通过计算采集周期内/proc/diskstats中对应设备第十一列数据的变化得出磁盘写操作平均耗时。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象磁盘I/O使用率。

通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化得出磁盘I/O使用率。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标反映指定时间段内磁盘的繁忙程度,可用于评估磁盘I/O性能,指标值越大代表磁盘越繁忙,I/O性能越差。

通过计算采集周期内/proc/diskstats中对应设备第十四列数据的变化与指标采集周期时间相除得出指标的值。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计指定时间段内,平均每个写I/O操作传输的字节数。

通过计算采集周期内/proc/diskstats中对应设备第十列数据的变化与第八列数据的变化相除得出磁盘平均写操作大小。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计指定时间段内,平均每个读I/O操作传输的字节数。

通过计算采集周期内/proc/diskstats中对应设备第六列数据的变化与第四列数据的变化相除得出磁盘平均读操作大小。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计指定时间段内,平均每个读或写I/O的操作时长。

通过计算采集周期内/proc/diskstats中对应设备第十三列数据的变化与第四列数据和第八列数据和的变化相除得出磁盘平均I/O时长。

挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象物理磁盘使用率,以百分比为单位。计算方式为: 所有已挂载磁盘分区已用存储量/磁盘存储总量。

监控周期(原始指标)

(Agent) 文件系统读写状态

该指标用于统计测量对象挂载文件系统的读写状态。状态分为:可读写(0)/只读(1)。

采集方式(Linux):通过读取/proc/mounts中第四列文件系统挂载参数获得。

该指标用于统计测量对象当前磁盘的inode空间量。

采集方式(Linux):执行df -i命令,查看Inodes列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象当前磁盘已使用的inode空间量。

采集方式(Linux):执行df -i命令,查看IUsed列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

该指标用于统计测量对象当前磁盘已使用的inode占比。

采集方式(Linux):执行df -i命令,查看IUse%列数据。挂载点前缀路径长度不能超过64个字符,必须以字母开头,只能包含0-9/a-z/A-Z/-/./~。

Windows系统暂不支持文件系统类监控指标。

监控周期(原始指标)

该指标用于统计测量对象网卡每秒发送的比特数。

该指标用于统计测量对象网卡每秒接收的比特数。

该指标用于统计测量对象网卡每秒接收的数据包数。

该指标用于统计测量对象网卡每秒发送的数据包数。

该指标用于统计测量对象网卡每秒接收的错误数据包数量占所接收的数据包的比率。

该指标用于统计测量对象网卡每秒发送的错误数据包数量占所发送的数据包的比率。

该指标用于统计测量对象网卡每秒接收并已丢弃的数据包数量占所接收的数据包的比率

该指标用于统计测量对象网卡每秒发送并已丢弃的数据包数量占所发送的数据包的比率。

监控周期(原始指标)

该指标用于统计测量对象当前NTP偏移量。

监控周期(原始指标)

该指标用于统计测量对象所有状态的TCP连接数总和。

该指标用于统计测量对象处于ESTABLISHED状态的TCP连接数量。

该指标用于统计测量对象处于请求连接状态的TCP连接数量。

该指标用于统计测量对象服务器端收到的请求连接的TCP数量。

该指标用于统计测量对象客户端主动关闭且没有收到服务端ACK的TCP连接数量。

该指标用于统计测量对象处于FIN_WAIT2状态的TCP连接数量。

该指标用于统计测量对象处于TIME_WAIT状态的TCP连接数量。

该指标用于统计测量对象关闭的或未打开的TCP连接数量。

该指标用于统计测量对象处于CLOSE_WAIT状态的TCP连接数量。

该指标用于统计测量对象被动关闭等待ACK报文的TCP连接数量。

该指标用于统计测量对象处于LISTEN状态的TCP连接数量。

该指标用于统计测量对象处于服务端和客户端同时主动关闭状态的TCP连接数量。

该指标用于统计测量对象重新发送的报文数与总发送的报文数之间的比值。

监控周期(原始指标)

该指标用于统计虚拟机上GPU健康状态,是一个综合指标。

该指标用于统计该GPU的编码能力使用率。

该指标用于统计该GPU的解码能力使用率。

该指标用于统计该GPU重置以来可纠正的ECC错误数量,每次重置后归0。

(Agent) 不可纠正ECC错误数量

该指标用于统计该GPU重置以来不可纠正的ECC错误数量,每次重置后归0。

(Agent) 累计可纠正ECC错误数量

该指标用于统计该GPU累计的可纠正ECC错误数量。

(Agent) 累计不可纠正ECC错误数量

该指标用于统计该GPU累计的不可纠正ECC错误数量。

该指标用于统计该GPU当前卡隔离的单比特页的数量。

该指标用于统计该GPU当前卡隔离的双比特页的数量。

该指标用于统计该GPU的性能状态。

该指标用于统计该GPU的显存使用率。

该指标用于统计该GPU的算力使用率。

该指标用于统计该GPU的显存剩余量。

该指标用于统计该GPU的显卡(着色器)时钟频率。

该指标用于统计该GPU的内存时钟频率。

该指标用于统计该GPU的功率。

该指标用于统计该GPU的PCI入方向流量。

(Agent) GPU流式处理器时钟频率

该指标用于统计该GPU的流式处理器时钟频率。

该指标用于统计该GPU的温度。

该指标用于统计该GPU的PCI出方向带宽。

该指标用于统计该GPU的显存使用量。

该指标用于统计该GPU的视频(包含编解码)时钟频率。

监控周期(原始指标)

该指标用于统计虚拟机上NPU卡的健康状态,是一个综合指标。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的显存使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的AI核心使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的AI CPU的使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的控制CPU的使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的显存的带宽使用率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU的显存的时钟频率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU AI核心的时钟频率。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU 显存的使用量。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU卡当前的单比特页错误的数量。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU卡当前的多比特页错误的数量。

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU卡的功率。其中,310卡仅支持显示额定功率,其余卡显示实际功率

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

该指标用于统计该NPU卡当前的温度

采集方式(Linux):通过调用NPU卡的libdcmi.so库文件获取。

Windows系统暂不支持NPU类监控指标。

监控周期(原始指标)

该指标用于统计虚拟机上DAVP卡的健康状态,是一个综合指标。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的显存使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的显存使用量

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的AI核心的使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的vdsp核心使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

(Agent) DAVP卡编码核心使用率

该指标用于统计该DAVP的编码核心使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

(Agent) DAVP卡解码核心使用率

该指标用于统计该DAVP卡的解码核心使用率。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

该指标用于统计该DAVP卡的系统模块温度。

采集方式(Linux):通过调用DAVP卡的vatools工具下的libvaml.so库文件获取。

Windows系统暂不支持DAVP类监控指标。

该取值可通过云监控服务的“”获取。

云服务器磁盘的挂载点。

该取值可通过云监控服务的“”获取。

GPU类型云服务器中显卡。

该取值可通过云监控服务的“”获取。

NPU类型云服务器中显卡。

该取值可通过云监控服务的“”获取。

DAVP类型云服务器,其中搭载了DaoCloud DAVP1视频加速卡。

该取值可通过云监控服务的“”获取。

在使用文档中是否遇到以下问题

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

提供免费备案服务

云业务全流程支持

华为云微信小程序

华为云微信小程序

增值电信业务经营许可证:B1.B2-20200593 | 域名注册服务机构许可:黔D3-20230001 | 代理域名注册服务机构:新网、西数


本文地址: https://www.earthnavs.com/jishuwz/500ca69ebdeed0827c1c.html
全局中部横幅
网易

网易是中国领先的互联网技术公司,为用户提供免费邮箱、游戏、搜索引擎服务,开设新闻、娱乐、体育等30多个内容频道,及博客、视频、论坛等互动交流,网聚人的力量。

国家划分

国外网站大全为您分享亚洲、北美、欧洲等六大洲,美国、日本、韩国、英国等上百个国家的各个类型的著名国外网站。

666资源站

最优质的资源集合

南方周末

该站点未添加描述description...

Client

该站点未添加描述description...

新抖

新抖是新榜旗下的抖音短视频&直播电商数据工具,不仅提供抖音热门视频、抖音话题挑战赛等抖音创意素材,抖音号及MCN机构排行查找,还提供打卡探店、直播带货、明星直播监测、短视频种草带货、热卖商品、品牌营销等全面的短视频在线数据服务,助力达人运营,DOU+监测,选号投放

seo基础知识

我们梵吉seo专注百度SEO优化领域,本站总结了seo基础入门教程,让零基础的朋友可以快速学会SEO,并提供了SEO快速进阶技术、百度云视频教程、seo面试测试题、seo实战培训。希望可以帮助到更多的新手朋友们!

顶象

顶象防御云,致力于帮助企业构建自主可控的业务安全体系,通过智能无感验证码、端加固、设备指纹、实时决策、安全感知防御平台等产品解决业务欺诈威胁,防范化解各类网络黑灰产风险,让业务更加健康稳定,助力企业创新与增长。

又拍云

国内知名企业级云服务商,全球1100多个自建CDN节点,10TB保有带宽,为25万用户提供CDN加速,数据云存储,HTTPS/SSL证书,WebP,云处理,视频图片存储,短视频开发SDK,直播开发SDK,DDos高防等一站式加速解决方案!

冒泡网

冒泡网创为您免费分享网络创业项目、网创经验、各大网创论坛VIP教程、创业交流、网创经验交流等,帮助大家获取最新创业项目信息!