集群指标

MapReduce BMR

  • 发行版本
  • 功能发布记录
  • 产品描述
    • 节点类型说明
    • 产品优势
    • 应用场景
    • 产品功能
    • 产品简介
  • Python-SDK
    • Cluster(集群)
    • BmrClient
    • 异常处理
    • InstanceGroup(实例组)
    • 简介
    • 文档更新记录
    • Step(作业)
    • 版本变更记录
    • Instance(实例)
    • 快速入门
    • 安装SDK工具包
  • 开源组件介绍
    • Impala
    • Pig
    • Druid
    • Presto
    • Hue
    • Ooize
    • HBase
    • Kudu
    • Sqoop
    • Hadoop-Streaming
    • Zeppelin
    • Alluxio
    • Kerberos
      • 集群互信配置
      • 概述
    • ClickHouse
      • 常见问题
      • 数据迁移同步
        • 从Spark导入
        • 从Kafka同步数据
        • 将自建ClickHouse数据迁移到云ClickHouse中
        • 从Flink导入
        • 从MySQL导入和同步
        • 从本地数据导入
          • Parquet格式
          • JSON
          • SQL转储
          • CSV and TSV
      • 快速入门
        • 访问模式
        • 客户端登录
        • 创建ClickHouse集群
        • 基础操作
      • 运维相关操作
        • ClickHouse集群扩容
        • ClickHouse集群缩容
        • 日志配置说明
        • 监控告警配置
    • Ranger
      • ranger概述
      • 权限策略配置
    • Paimon
      • Hive示例
      • StarRocks示例
      • 联合查询示例
      • Flink示例
      • Spark示例
    • Flink
      • 基础使用
    • Trino
      • 基础使用
      • 概述
    • Spark
      • 引擎增强
      • 基础使用
    • Hive
      • 开发指南
        • 自定义函数(UDF)
      • 实践操作
        • Hive迁移
        • Hive操作HBase外表
      • 基础使用
        • Hive基础操作
        • Hive连接方式
  • Java-SDK
    • Cluster(集群)
    • 异常
    • BmrClient
    • InstanceGroup(实例组)
    • 日志
    • 文档更新记录
    • 版本更新记录
    • Step(作业)
    • Instance(实例)
    • 快速入门
    • 安装SDK工具包
    • 概述
  • 快速入门
    • 操作流程概览
    • 环境准备
    • 创建集群
    • 数据准备
    • 开发作业
    • 查看结果
    • ClickHouse
      • 导入数据
      • 创建数据库
      • 连接集群
      • 创建表
  • 操作指南
    • 集群模板
    • 服务管理
    • 集群配置
      • 用户管理
      • 弹性伸缩
      • 创建集群
      • 集群安全模式
      • EIP
      • Hive元数据说明
      • 集群审计
      • 配置已有集群
      • 安全组
    • 管理作业
      • 创建作业
      • 诊断、调优
      • 定时任务
      • 查看作业
    • 访问集群
      • 访问集群服务页面
      • 访问集群-openVPN访问集群
      • 使用OpenVPN提交Hadoop作业
      • SSH连接到集群
    • 实践操作
      • 存储数据至HBase
      • 导入数据
      • 编译Maven项目
      • Sqoop导入导出数据
        • 导出数据
    • 权限管理
      • 多用户访问控制
      • 用户管理
    • 集群管理
      • 节点管理
      • 监控报警
      • 集群指标
      • 资源管理
  • 服务等级协议SLA
    • BMR服务等级协议SLA
  • API参考
    • 通用说明
    • 公共头
    • 数据类型
    • 版本更新记录
    • 服务域名
    • 实例操作接口
    • 实例组操作接口
    • 集群操作接口
    • API简介
    • 错误码
  • 常见问题
    • 安全性问题
    • 计费类问题
    • 常见问题总览
    • 性能类问题
    • 配置类问题
    • 故障类问题
  • 视频专区
    • 操作指南
    • 产品介绍
  • 场景教程
    • 流式应用场景
    • 离线应用场景
    • 使用Hive分析网站日志
    • Sqoop应用文档
    • 定时分析日志数据
    • HIVE
      • 不同集群的 Hive 迁移方案
      • Hive 操作 Hbase 外部表
  • 产品定价
    • 转换计费方式
    • 计费项
    • 到期或欠费说明
    • 包年包月计费
    • 续费说明
    • 变更配置计费说明
    • 计费方式
    • 按需计费
    • 账单和用量查询
    • 退款说明
所有文档
menu
没有找到结果,请重新输入

MapReduce BMR

  • 发行版本
  • 功能发布记录
  • 产品描述
    • 节点类型说明
    • 产品优势
    • 应用场景
    • 产品功能
    • 产品简介
  • Python-SDK
    • Cluster(集群)
    • BmrClient
    • 异常处理
    • InstanceGroup(实例组)
    • 简介
    • 文档更新记录
    • Step(作业)
    • 版本变更记录
    • Instance(实例)
    • 快速入门
    • 安装SDK工具包
  • 开源组件介绍
    • Impala
    • Pig
    • Druid
    • Presto
    • Hue
    • Ooize
    • HBase
    • Kudu
    • Sqoop
    • Hadoop-Streaming
    • Zeppelin
    • Alluxio
    • Kerberos
      • 集群互信配置
      • 概述
    • ClickHouse
      • 常见问题
      • 数据迁移同步
        • 从Spark导入
        • 从Kafka同步数据
        • 将自建ClickHouse数据迁移到云ClickHouse中
        • 从Flink导入
        • 从MySQL导入和同步
        • 从本地数据导入
          • Parquet格式
          • JSON
          • SQL转储
          • CSV and TSV
      • 快速入门
        • 访问模式
        • 客户端登录
        • 创建ClickHouse集群
        • 基础操作
      • 运维相关操作
        • ClickHouse集群扩容
        • ClickHouse集群缩容
        • 日志配置说明
        • 监控告警配置
    • Ranger
      • ranger概述
      • 权限策略配置
    • Paimon
      • Hive示例
      • StarRocks示例
      • 联合查询示例
      • Flink示例
      • Spark示例
    • Flink
      • 基础使用
    • Trino
      • 基础使用
      • 概述
    • Spark
      • 引擎增强
      • 基础使用
    • Hive
      • 开发指南
        • 自定义函数(UDF)
      • 实践操作
        • Hive迁移
        • Hive操作HBase外表
      • 基础使用
        • Hive基础操作
        • Hive连接方式
  • Java-SDK
    • Cluster(集群)
    • 异常
    • BmrClient
    • InstanceGroup(实例组)
    • 日志
    • 文档更新记录
    • 版本更新记录
    • Step(作业)
    • Instance(实例)
    • 快速入门
    • 安装SDK工具包
    • 概述
  • 快速入门
    • 操作流程概览
    • 环境准备
    • 创建集群
    • 数据准备
    • 开发作业
    • 查看结果
    • ClickHouse
      • 导入数据
      • 创建数据库
      • 连接集群
      • 创建表
  • 操作指南
    • 集群模板
    • 服务管理
    • 集群配置
      • 用户管理
      • 弹性伸缩
      • 创建集群
      • 集群安全模式
      • EIP
      • Hive元数据说明
      • 集群审计
      • 配置已有集群
      • 安全组
    • 管理作业
      • 创建作业
      • 诊断、调优
      • 定时任务
      • 查看作业
    • 访问集群
      • 访问集群服务页面
      • 访问集群-openVPN访问集群
      • 使用OpenVPN提交Hadoop作业
      • SSH连接到集群
    • 实践操作
      • 存储数据至HBase
      • 导入数据
      • 编译Maven项目
      • Sqoop导入导出数据
        • 导出数据
    • 权限管理
      • 多用户访问控制
      • 用户管理
    • 集群管理
      • 节点管理
      • 监控报警
      • 集群指标
      • 资源管理
  • 服务等级协议SLA
    • BMR服务等级协议SLA
  • API参考
    • 通用说明
    • 公共头
    • 数据类型
    • 版本更新记录
    • 服务域名
    • 实例操作接口
    • 实例组操作接口
    • 集群操作接口
    • API简介
    • 错误码
  • 常见问题
    • 安全性问题
    • 计费类问题
    • 常见问题总览
    • 性能类问题
    • 配置类问题
    • 故障类问题
  • 视频专区
    • 操作指南
    • 产品介绍
  • 场景教程
    • 流式应用场景
    • 离线应用场景
    • 使用Hive分析网站日志
    • Sqoop应用文档
    • 定时分析日志数据
    • HIVE
      • 不同集群的 Hive 迁移方案
      • Hive 操作 Hbase 外部表
  • 产品定价
    • 转换计费方式
    • 计费项
    • 到期或欠费说明
    • 包年包月计费
    • 续费说明
    • 变更配置计费说明
    • 计费方式
    • 按需计费
    • 账单和用量查询
    • 退款说明
  • 文档中心
  • arrow
  • MapReduceBMR
  • arrow
  • 操作指南
  • arrow
  • 集群管理
  • arrow
  • 集群指标
本页目录
  • 集群仪表盘
  • 主机监控仪表盘
  • 服务监控
  • HDFS
  • HDFS NameNode
  • HDFS DataNode
  • HDFS JOURNALNODE
  • YARN
  • YARN TimeLineServer
  • YARN ResourceManager
  • YARN HISTORY_SERVER
  • YARN NodeManager
  • HIVE
  • HiveServer2
  • HiveMetastore
  • ZOOKEEPER
  • HBASE
  • HBASE_REGIONSERVER
  • HBASE_TABLE
  • CLICKHOUSE
  • CLICKHOUSE_SERVER
  • IMPALA
  • IMPALA_CATALOG
  • IMPALA_STATE_STORE
  • IMPALA_IMPALAD
  • KUDU
  • KUDU_TSERVER
  • KUDU_MASTER

集群指标

更新时间:2025-08-21

集群仪表盘

表一 集群仪表盘指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
cluster_YARNResource_precent YARN计算资源使用率 % ClusterId
cluster_YARNVCoreResource YARN计算资源(VCore) 个 ClusterId
cluster_YARNMemoryResource YARN计算资源(内存) GB ClusterId
cluster_HDFSResourceCapacity_precent HDFS存储资源使用率 % ClusterId
cluster_cpu_used_percent 集群平均CPU利用率 % ClusterId
cluster_disk_used_percent 集群平均磁盘利用率 % ClusterId
cluster_disk_max_partition_used_percent 集群最大磁盘利用率 % ClusterId
cluster_net_in_bitps 集群总网络入速率 KB ClusterId
cluster_net_out_bitps 集群总网络出速率 KB ClusterId
cluster_HDFSResourceCapacity HDFS存储资源 % ClusterId
cluster_mem_used_percent 集群平均内存利用率 % ClusterId
cluster_disk_total_size 集群磁盘总容量 GB ClusterId
cluster_disk_total_free 集群磁盘总空闲容量 GB ClusterId
cluster_disk_total_used 集群磁盘总使用容量 GB ClusterId

主机监控仪表盘

表二 主机监控仪表盘指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
cpu_user 用户CPU利用率 % InstanceId
cpu_sys 系统CPU利用率 % InstanceId
cpu_idle CPU空闲率 % InstanceId
cpu_wait_io 等待IOCPU时间比率 % InstanceId
mem_total 内存总量 GB InstanceId
mem_used 内存使用量 GB InstanceId
mem_free 内存空闲量 GB InstanceId
mem_cached 文件系统内存cache值 GB InstanceId
mem_buffers 块设备读写内存缓冲量 GB InstanceId
mem_used_percent 内存利用率 % InstanceId
swap_total 交换分区总量 GB InstanceId
swap_free 交换分区空闲量 GB InstanceId
swap_used 交换分区使用量 GB InstanceId
swap_used_percent 交换分区使用率 % InstanceId
disk_max_partition_used_percent 最大磁盘分区利用率 % InstanceId
disk_total_size 磁盘总空间量 GB InstanceId
disk_total_free 磁盘总空闲量 GB InstanceId
disk_total_used 磁盘总使用量 GB InstanceId
disk_total_used_percent 磁盘总使用率 % InstanceId
disk_total_write_kb 磁盘总写速率 KB/s InstanceId
disk_total_read_kb 磁盘总读速率 KB/s InstanceId
disk_size 单块磁盘总容量 GB InstanceId,DiskName
disk_free 单块磁盘空闲量 GB InstanceId,DiskName
disk_used 单块磁盘使用量 GB InstanceId,DiskName
disk_used_percent 单块磁盘使用率 % InstanceId,DiskName
disk_write_kb 单块盘写速率 KB/s InstanceId,DiskName
disk_read_kb 单块盘读速率 KB/s InstanceId,DiskName
disk_io_util 单块盘io使用率 % InstanceId,DiskName
disk_max_partition_io_util 最大磁盘io使用率 % InstanceId
fd_limitation 整机的fd上限 个 InstanceId
fd_used 整机已使用的fd个数 个 InstanceId
fd_used_percent 整机的fd使用率 % InstanceId
loadavg5 机器负载 个 InstanceId
net_total_in_bitps 整机网卡总接受速率 KB/s InstanceId
net_total_out_bitps 整机网卡总发送速率 KB/s InstanceId
net_tcp_curr_estab 已建立的TCP连接数 个 InstanceId
net_total_sockets_used socket连接句柄总数 个 InstanceId
net_tcp_close_wait CLOSE_WAIT状态连接数 个 InstanceId
host_connect_status 主机连接状态 -- InstanceId
bmr_agent_connect_status bmr-agent连接状态 -- InstanceId

服务监控

HDFS

表三 HDFS服务指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
dfs_FSNamesystem_BlockCapacity block的总容量 个 ServiceId
dfs_FSNamesystem_BlocksTotal block的当前容量 个 ServiceId
dfs_FSNamesystem_CapacityRemainingGB HDFS文件系统剩余的容量 GB ServiceId
dfs_FSNamesystem_CapacityTotalGB HDFS文件系统总体容量 GB ServiceId
dfs_FSNamesystem_CapacityUsedGB HDFS文件系统已使用的容量 GB ServiceId
dfs_FSNamesystem_CorruptBlocks 已损坏的block数量 个 ServiceId
dfs_FSNamesystem_ExcessBlocks 多余的block 个 ServiceId
dfs_FSNamesystem_ExpiredHeartbeats 超时的心跳 个 ServiceId
dfs_FSNamesystem_FilesTotal 文件总数 个 ServiceId
dfs_FSNamesystem_LastCheckpointTime 最近一次做checkpoint的时间 datatime ServiceId
dfs_FSNamesystem_LastWrittenTransactionId 最近一次写入的transactionid 个 ServiceId
dfs_FSNamesystem_MillisSinceLastLoadedEdits 距离上一次加载edit的时间 ms ServiceId
dfs_FSNamesystem_MissingBlocks 丢失的block数量 个 ServiceId
dfs_FSNamesystem_UnderReplicatedBlocks 副本个数不够的block 个 ServiceId
dfs_FSNamesystem_PendingDataNodeMessageCount datanode的请求被queue在standby namenode的个数 个 ServiceId
dfs_FSNamesystem_PendingDeletionBlocks 未被验证的block个数 个 ServiceId
dfs_FSNamesystem_PendingReplicationBlocks 等待被备份的block个数 个 ServiceId
dfs_FSNamesystem_PostponedMisreplicatedBlocks 被推迟处理的错误备份的block个数 个 ServiceId
dfs_FSNamesystem_ScheduledReplicationBlocks 排定要备份的block个数 个 ServiceId
dfs_FSNamesystem_TotalLoad namenode的Xceiver个数 个 ServiceId
dfs_FSNamesystem_TransactionsSinceLastLogRoll 从上次roll editlog起到现在新的transcation的个数 个 ServiceId
dfs_FSNamesystem_CapacityUsed_percent HDFS容量使用率 % ServiceId
dfs_FSNamesystem_NumLiveDataNodes DataNode正常节点数 个 ServiceId
dfs_FSNamesystem_NumDeadDataNodes DataNode异常节点数 个 ServiceId
dfs_FSNamesystem_VolumeFailuresTotal DataNode坏卷数 个 ServiceId
dfs_namenode_Safemode 安全模式 个 ServiceId

HDFS NameNode

表四 HDFS组件指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
dfs_namenode_MemHeapCommitted heap已提交的内存 MB ComponentId
dfs_namenode_MemHeapMaxM heap总内存 MB ComponentId
dfs_namenode_MemHeapUsedM heap使用的内存 MB ComponentId
dfs_namenode_MemMaxM 最大内存 MB ComponentId
dfs_namenode_MemNonHeapCommittedM 非堆内存提交 MB ComponentId
dfs_namenode_MemNonHeapMaxM 最大非堆内存 MB ComponentId
dfs_namenode_MemNonHeapUsedM 非堆内存使用 MB ComponentId
dfs_namenode_SafeModeTime safemode时间 ms ComponentId
dfs_namenode_AddBlockOps 写入block次数 次 ComponentId
dfs_namenode_BlockReportAvgTime block report的平均时间次数 ms ComponentId
dfs_namenode_BlockReportNumOps block report的次数 次 ComponentId
dfs_namenode_CreateFileOps 创建文件次数 次 ComponentId
dfs_namenode_DeleteFileOps 删除文件次数 次 ComponentId
dfs_namenode_FileInfoOps 查看文件info次数 次 ComponentId
dfs_namenode_FilesCreated 已创建的文件个数 个 ComponentId
dfs_namenode_FilesDeleted 已删除的文件个数 个 ComponentId
dfs_namenode_FilesInGetListingOps getlist操作次数 次 ComponentId
dfs_namenode_FilesRenamed 重命名文件个数 个 ComponentId
dfs_namenode_FsImageLoadTime fsimage加载时间 ms ComponentId
dfs_namenode_GetAdditionalDatanodeOps GetAdditionalDatanode操作次数 次 ComponentId
dfs_namenode_GetBlockLocations 获取block位置操作次数 次 ComponentId
dfs_namenode_GetListingOps getListing操作次数 次 ComponentId
dfs_namenode_SyncsAvgTime 将操作同步为editlog的平均时间 ms ComponentId
dfs_namenode_SyncsNumOps 将操作同步为editlog的次数 次 ComponentId
dfs_namenode_TransactionsAvgTime transcation的平均时间 ms ComponentId
dfs_namenode_TransactionsBatchedInSync transcation在flush时发现已经被sync的情况的次数 次 ComponentId
dfs_namenode_TransactionsNumOps transcation的个数 个 ComponentId

HDFS DataNode

表五 HDFS DataNode组件指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
dfs_datanode_MemHeapCommittedM heap已提交的内存 MB ComponentId
dfs_datanode_MemHeapMaxM heap总内存 MB ComponentId
dfs_datanode_MemHeapUsedM heap使用的内存 MB ComponentId
dfs_datanode_MemMaxM 最大内存 MB ComponentId
dfs_datanode_MemNonHeapCommittedM 非堆内存提交 MB ComponentId
dfs_datanode_MemNonHeapMaxM 最大非堆内存 MB ComponentId
dfs_datanode_MemNonHeapUsedM 非堆内存使用 MB ComponentId
dfs_datanode_BlockReportsAvgTime 向namenode汇报block的平均时间 ms ComponentId
dfs_datanode_BlockReportsNumOps 向namenode汇报block的次数 次 ComponentId
dfs_datanode_BlocksRead 从硬盘读块的次数 次 ComponentId
dfs_datanode_BlocksRemoved 删除块的个数 次 ComponentId
dfs_datanode_BlocksReplicated 备份块操作的个数 个 ComponentId
dfs_datanode_BlocksVerified 验证块的次数 次 ComponentId
dfs_datanode_BlocksWritten 写入块的个数 个 ComponentId
dfs_datanode_BytesRead 读出总字节 bytes ComponentId
dfs_datanode_BytesWritten 写入总字节 bytes ComponentId
dfs_datanode_CopyBlockOpAvgTime 复制块的平均时间 ms ComponentId
dfs_datanode_CopyBlockOpNumOps 复制块的次数 次 ComponentId
dfs_datanode_HeartbeatsAvgTime 向namenode汇报的平均时间 ms ComponentId
dfs_datanode_HeartbeatsNumOps 向namenode汇报的次数 次 ComponentId
dfs_datanode_ReadBlockOpAvgTime 读数据块的平均时间 ms ComponentId
dfs_datanode_ReadBlockOpNumOps 读数据块的次数 次 ComponentId
dfs_datanode_ReadsFromLocalClient 本地读取的次数 次 ComponentId
dfs_datanode_ReadsFromRemoteClient 远程读取的次数 次 ComponentId
dfs_datanode_WriteBlockOpAvgTime 写数据块的平均时间 ms ComponentId
dfs_datanode_WriteBlockOpNumOps 写数据块的次数 次 ComponentId
dfs_datanode_WritesFromLocalClient 写本地的次数 次 ComponentId
dfs_datanode_WritesFromRemoteClient 写远程的次数 次 ComponentId
dfs_datanode_PacketAckRoundTripTimeNanosAvgTime 包确认平均时间 ms ComponentId
dfs_datanode_PacketAckRoundTripTimeNanosNumOps 包确认次数 次 ComponentId
dfs_datanode_FlushNanosAvgTime 文件系统flush平均时间 ms ComponentId
dfs_datanode_FlushNanosNumOps 文件系统flush平均时间 ms ComponentId
dfs_datanode_ReplaceBlockOpAvgTime 块替换平均时间 ms ComponentId
dfs_datanode_ReplaceBlockOpNumOps 块替换次数 次 ComponentId
dfs_datanode_SendDataPacketBlockedOnNetworkNanosAvgTime 网络上发送块平均时间 ms ComponentId
dfs_datanode_SendDataPacketBlockedOnNetworkNanosNumOps 网络上发生块次数 次 ComponentId
dfs_datanode_SendDataPacketTransferNanosAvgTime 网络上发送包平均时间 ms ComponentId
dfs_datanode_SendDataPacketTransferNanosNumOps 网络上发送包个数 个 ComponentId
dfs_datanode_FsStat_Capacity DataNode容量 GB ComponentId
dfs_datanode_FsStat_DfsUsed DataNode使用量 GB ComponentId
dfs_datanode_FsStat_NumFailedVolumes 坏卷数量 GB ComponentId

HDFS JOURNALNODE

表六 HDFS JOURNALNODE组件指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
status 进程运行状态 state ComponentId
proc cpu usage 进程cpu利用率 % ComponentId
proc mem usage 进程内存利用率 % ComponentId
jvm gc o jvm gc o % ComponentId
jvm_gc E jvm_gc E % ComponentId
jvm_gc M jvm_gc M % ComponentId
jvm gc ccs jvm gc ccs % ComponentId
jvm gc yGcT jvm gc yGcT % ComponentId
jvm gc FGCT jvm gc FGCT % ComponentId
jvm_gc_GCT jvm_gc_GCT % ComponentId
jvm_gc_YGC jvm_gc_YGC % ComponentId
jvm_gc_FGC jvm_gc_FGC % ComponentId

YARN

表七 YARN服务指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
yarn_ClusterMetrics_NumActiveNMs 活的nodemanager个数 个 ServiceId
yarn_ClusterMetrics_NumLostNMs 丢失的nodemanager个数 个 ServiceId
yarn_ClusterMetrics_NumUnhealthyNMs 不健康的nodemanager个数 个 ServiceId
yarn_QueueMetrics_TotalMB 总内存 GB ServiceId
yarn_QueueMetrics_TotalVCores 总vcores 个 ServiceId
yarn_QueueMetrics_ActiveApplications 活跃的task的个数 个 ServiceId
yarn_QueueMetrics_ActiveUsers 活跃的用户个数 个 ServiceId
yarn_QueueMetrics_AggregateContainersAllocated 总共分配的container个数 个 ServiceId
yarn_QueueMetrics_AggregateContainersReleased 总共释放的container个数 个 ServiceId
yarn_QueueMetrics_AllocatedContainers 已经分配的container个数 个 ServiceId
yarn_QueueMetrics_AllocatedMB 已经分配的内存 GB ServiceId
yarn_QueueMetrics_AllocatedVCores 已分配的vcore 个 ServiceId
yarn_QueueMetrics_AppsCompleted 已完成的task数 个 ServiceId
yarn_QueueMetrics_AppsPending 挂起的task数 个 ServiceId
yarn_QueueMetrics_AppsRunning 运行的task数 个 ServiceId
yarn_QueueMetrics_AppsSubmitted 已经提交的task数 个 ServiceId
yarn_QueueMetrics_AvailableMB 可用的内存 GB ServiceId
yarn_QueueMetrics_AvailableVCores 可用的vcore 个 ServiceId
yarn_QueueMetrics_PendingContainers 挂起的container数 个 ServiceId
yarn_QueueMetrics_PendingMB 挂起的内存 GB ServiceId
yarn_QueueMetrics_PendingVCores 挂起的vcore 个 ServiceId
yarn_QueueMetrics_running_0 运行时间在0-60分钟内的task个数 个 ServiceId
yarn_QueueMetrics_running_1440 运行时间在1440分钟以上的task个数 个 ServiceId
yarn_QueueMetrics_running_300 运行时间在300-1440分钟内的task个数 个 ServiceId
yarn_QueueMetrics_running_60 运行时间在60-300分钟内的task个数 个 ServiceId
yarn_QueueMetrics_AllocatedMem_precent 分配内存占比 % ServiceId
yarn_QueueMetrics_AllocatedVCore_precent 分配VCore占比 % ServiceId

YARN TimeLineServer

表八 yarn TimeLineServer组件指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
yarn_timeline_GetEntitiesOps TimelineServer获取批量entities操作数 次 ComponentId
yarn_timeline_GetEntitiesTimeAvgTime TimelineServer获取批量entities平均时间 ms ComponentId
yarn_timeline_GetEntityOps TimelineServer获取entity操作数 次 ComponentId
yarn_timeline_GetEntityTimeAvgTime TimelineServer获取entity平均时间 ms ComponentId
yarn_timeline_GetEventsOps TimelineServer获取批量events操作数 次 ComponentId
yarn_timeline_GetEventsTimeAvgTime TimelineServer获取批量evnets平均时间 ms ComponentId
yarn_timeline_PostEntitiesOps TimelineServer更新批量entities操作数 次 ComponentId
yarn_timeline_PostEntitiesTimeAvgTime TimelineServer更新批量entities的平均时间 ms ComponentId
yarn_timeline_PutDomainOps TimelineServer更新Domain操作数 次 ComponentId
yarn_timeline_PutDomainTimeAvgTime TimelineServer更新Domain平均时间 ms ComponentId
yarn_timeline_GetDomainOps TimelineServer获取Domain操作数 次 ComponentId
yarn_timeline_GetDomainTimeAvgTime TimelineServer获取Domain平均时间 ms ComponentId
yarn_timeline_GetDomainsOps TimelineServer批量获取Domains操作数 次 ComponentId
yarn_timeline_GetDomainsTimeAvgTime TimelineServer批量获取Domains平均时间 ms ComponentId

YARN ResourceManager

表九 YARN ResourceManager指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
status 进程运行状态 state ComponentId
proc cpu usage 进程cpu利用率 % ComponentId
proc mem usage 进程内存利用率 % ComponentId
jvm gc o jvm gc o % ComponentId
jvm_gc E jvm_gc E % ComponentId
jvm_gc M jvm_gc M % ComponentId
jvm gc ccs jvm gc ccs % ComponentId
jvm gc yGcT jvm gc yGcT % ComponentId
jvm gc FGCT jvm gc FGCT % ComponentId
jvm_gc_GCT jvm_gc_GCT % ComponentId
jvm_gc_YGC jvm_gc_YGC % ComponentId
jvm_gc_FGC jvm_gc_FGC % ComponentId

YARN HISTORY_SERVER

表十 YARN HISTORY_SERVER指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
status 进程运行状态 state ComponentId
proc cpu usage 进程cpu利用率 % ComponentId
proc mem usage 进程内存利用率 % ComponentId
jvm gc o jvm gc o % ComponentId
jvm_gc E jvm_gc E % ComponentId
jvm_gc M jvm_gc M % ComponentId
jvm gc ccs jvm gc ccs % ComponentId
jvm gc yGcT jvm gc yGcT % ComponentId
jvm gc FGCT jvm gc FGCT % ComponentId
jvm_gc_GCT jvm_gc_GCT % ComponentId
jvm_gc_YGC jvm_gc_YGC % ComponentId
jvm_gc_FGC jvm_gc_FGC % ComponentId

YARN NodeManager

表十一 YARN NodeManager指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
status 进程运行状态 state ComponentId
proc cpu usage 进程cpu利用率 % ComponentId
proc mem usage 进程内存利用率 % ComponentId
jvm gc o jvm gc o % ComponentId
jvm_gc E jvm_gc E % ComponentId
jvm_gc M jvm_gc M % ComponentId
jvm gc ccs jvm gc ccs % ComponentId
jvm gc yGcT jvm gc yGcT % ComponentId
jvm gc FGCT jvm gc FGCT % ComponentId
jvm_gc_GCT jvm_gc_GCT % ComponentId
jvm_gc_YGC jvm_gc_YGC % ComponentId
jvm_gc_FGC jvm_gc_FGC % ComponentId

HIVE

HiveServer2

表十二 HIVE组件指标说明1

指标英文名称(metric name) 指标中文名称 单位 维度
hive_hs2_active_sessions 当前活跃Session数 个 ComponentId
hive_hs2_open_sessions 当前打开的Session数 个 ComponentId
hive_hs2_open_connections 当前打开的连接数 个 ComponentId
hive_hs2_cumulative_connection_count 累计连接数 个 ComponentId
hive_hs2_active_calls_api_runTasks 当前Runtask请求数 个 ComponentId
hive_hs2_compiling_queries 执行编译的平均时间 ms ComponentId
hive_hs2_executing_queries 执行查询的平均时间 ms ComponentId
hive_hs2_submitted_queries 提交查询的平均时间 ms ComponentId
hive_hs2_succeeded_queries 服务启动后成功的查询数 个 ComponentId
hive_hs2_sql_operation_active_user 当前活跃用户数 个 ComponentId
hive_hs2_completed_sql_operation_FINISHED 已结束的SQL总数 个 ComponentId
hive_hs2_sql_operation_PENDING SQL任务处于PEEDING状态平均时间 ms ComponentId
hive_hs2_sql_operation_RUNNING SQL任务处于RUNNING状态平均时间 ms ComponentId
status 进程运行状态 state ComponentId
proc cpu usage 进程cpu利用率 % ComponentId
proc mem usage 进程内存利用率 % ComponentId
jvm gc o jvm gc o % ComponentId
jvm_gc E jvm_gc E % ComponentId
jvm_gc M jvm_gc M % ComponentId
jvm gc ccs jvm gc ccs % ComponentId
jvm gc yGcT jvm gc yGcT % ComponentId
jvm gc FGCT jvm gc FGCT % ComponentId
jvm_gc_GCT jvm_gc_GCT % ComponentId
jvm_gc_YGC jvm_gc_YGC % ComponentId
jvm_gc_FGC jvm_gc_FGC % ComponentId

HiveMetastore

表十三 HIVE组件指标说明2

指标英文名称(metric name) 指标中文名称 单位 维度
hive_metastore_active_calls_drop_table 当前活跃DropTable请求数 次 ComponentId
hive_metastore_api_alter_table AlterTable请求平均时间 ms ComponentId
hive_metastore_api_alter_table_with_environment_context AlterTableWithEnvContext请求平均时间 ms ComponentId
hive_metastore_api_create_table CreateTable请求平均时间 ms ComponentId
hive_metastore_api_create_table_with_environment_context CreateTableWithEnvContext请求平均时间 ms ComponentId
hive_metastore_api_drop_table DropTable请求平均时间 ms ComponentId
hive_metastore_api_drop_table_with_environment_context DropTableWithEnvContext请求平均时间 ms ComponentId
hive_metastore_api_get_table GetTable请求平均时间 ms ComponentId
hive_metastore_api_get_table_req GetTableReq请求平均时间 ms ComponentId
hive_metastore_api_get_table_objects_by_name_req GetTableObjectsByName请求平均时间 ms ComponentId
hive_metastore_api_get_tables GetTables请求平均时间 ms ComponentId
hive_metastore_api_get_tables_by_type GetTablesByType请求平均时间 ms ComponentId
hive_metastore_api_get_multi_table GetMultiTable请求平均时间 ms ComponentId
hive_metastore_api_get_table_statistics_req GetTableStatistics请求平均时间 ms ComponentId
hive_metastore_api_get_all_databases GetAllDatabases请求平均时间 ms ComponentId
hive_metastore_api_get_database GetDatabase请求平均时间 ms ComponentId
hive_metastore_api_get_databases GetDatabases请求平均时间 ms ComponentId
hive_metastore_api_get_all_functions GetAllFunctions请求平均时间 ms ComponentId

ZOOKEEPER

表十四 ZOOKEEPER组件指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
zk_avg_latency 平均响应延迟 ms ComponentId
zk_max_latency 最大响应延迟 ms ComponentId
zk_min_latency 最小响应延迟 ms ComponentId
zk_packets_received 收包数 个 ComponentId
zk_packets_sent 发包数 个 ComponentId
zk_num_alive_connections 活跃连接数 个 ComponentId
zk_outstanding_requests 堆积请求数 个 ComponentId
zk_server_state 主从状态 个 ComponentId
zk_znode_count znode数 个 ComponentId
zk_watch_count watch数 个 ComponentId
zk_ephemerals_count 临时节点数 个 ComponentId
zk_approximate_data_size 近似数据总和大小 bytes ComponentId
zk_open_file_descriptor_count 打开文件描述符数 个 ComponentId
zk_max_file_descriptor_count 最大文件描述符数 个 ComponentId
status 进程运行状态 state ComponentId
proc cpu usage 进程cpu利用率 % ComponentId
proc mem usage 进程内存利用率 % ComponentId
jvm gc o jvm gc o % ComponentId
jvm_gc E jvm_gc E % ComponentId
jvm_gc M jvm_gc M % ComponentId
jvm gc ccs jvm gc ccs % ComponentId
jvm gc yGcT jvm gc yGcT % ComponentId
jvm gc FGCT jvm gc FGCT % ComponentId
jvm_gc_GCT jvm_gc_GCT % ComponentId
jvm_gc_YGC jvm_gc_YGC % ComponentId
jvm_gc_FGC jvm_gc_FGC % ComponentId

HBASE

表十五 HBASE服务指标说明

指标英文名称(metric name) 指标中文名称 单位 维度
hbase_ritCount 处于RIT的Region个数 个 ServiceId
hbase_ritCountOverThreshold 处于超时的RIT的Region个数 个 ServiceId
hbase_ritOldestAge RIT的最长时间 ms ServiceId
hbase_averageLoad 平均负载 个 ServiceId
hbase_numRegionServers 活动的RS数量 个 ServiceId
hbase_numDeadRegionServers 停止的RS数量 个 ServiceId
hbase_clusterRequests 集群总请求数量 个 ServiceId
hbase_mergePlanCount Merge计划数 个 ServiceId
hbase_splitPlanCount Split计划数 个 ServiceId
hbase_receivedBytes 接受字节数 Bytes ServiceId
hbase_sentBytes 发送字节数 Bytes ServiceId
hbase_queueSize 排队队列大小 个 ServiceId
hbase_numCallsInGeneralQueue 普通队列调用数 次 ServiceId
hbase_numCallsInReplicationQueue 副本队列调用数 次 ServiceId
hbase_numCallsInPriorityQueue 优先队列调用数 次 ServiceId
hbase_numOpenConnections 保持的链接数的大小 个 ServiceId
hbase_numActiveHandler 活跃的handler 个 ServiceId
hbase_numGeneralCallsDropped 丢失的普通请求数 次 ServiceId
hbase_numLifoModeSwitches 栈模式切换数 次 ServiceId
hbase_authenticationSuccesses 认证成功数 次 ServiceId
hbase_authenticationFailures 认证失败次数 次 ServiceId
hbase_authenticationFallbacks 认证退却次数 次 ServiceId
hbase_authorizationSuccesses 授权成功次数 次 ServiceId
hbase_authorizationFailures 授权失败数 次 ServiceId
hbase_exceptions_RegionMovedException Region状态迁移错误数 次 ServiceId
hbase_exceptions_multiResponseTooLarge 接收到多个相应超出限定阈值 次 ServiceId
hbase_exceptions_RegionTooBusyException RegionServer任务过多导致错误的数量 次 ServiceId
hbase_exceptions_FailedSanityCheckException FailedSanityCheckException 次 ServiceId
hbase_exceptions_UnknownScannerException 未知扫描错误 次 ServiceId
hbase_exceptions_OutOfOrderScannerNextException 乱序扫描错误 次 ServiceId
hbase_exceptions_NotServingRegionException NotServingRegionException 次 ServiceId
hbase_exceptions_callQueueTooBig 等待队列满错误 次 ServiceId
hbase_exceptions_ScannerResetException 扫描器重置错误 次 ServiceId
hbase_exceptions 总错误数 次 ServiceId
hbase_ProcessCallTime_num_ops 总操作数 次 ServiceId
hbase_ProcessCallTime_min 处理时间最小值 ms ServiceId
hbase_ProcessCallTime_max 处理时间最大值 ms ServiceId
hbase_ProcessCallTime_mean 处理时间平均值 ms ServiceId
hbase_QueueCallTime_num_opsHBASE_REGIONSERVER 队列调用次数 次 ServiceId
hbase_QueueCallTime_min 调用最短时间 ms ServiceId
hbase_QueueCallTime_max 调用最长时间 ms ServiceId
hbase_QueueCallTime_mean 调用平均时间 ms ServiceId

HBASE_REGIONSERVER

表十六 HBASE组件指标说明1

指标英文名称(metric name) 指标中文名称 单位 维度
hbase_rs_averageRegionSize Region平均大小 Bytes ComponentId
hbase_rs_regionCount Region个数 个 ComponentId
hbase_rs_percentFilesLocalSecondaryRegions Region副本本地化 % ComponentId
hbase_rs_hlogFileCount WAL文件数量 个 ComponentId
hbase_rs_hlogFileSize WAL文件大小 Bytes ComponentId
hbase_rs_memStoreSize Memstore大小 MB ComponentId
hbase_rs_storeCount Store个数 个 ComponentId
hbase_rs_storeFileCount Storefile个数 个 ComponentId
hbase_rs_storeFileSize Storefile 大小 MB ComponentId
hbase_rs_storeFileIndexSize storeFileIndexSize Bytes ComponentId
hbase_rs_staticIndexSize staticIndexSize Bytes ComponentId
hbase_rs_staticBloomSize staticBloomSize Bytes ComponentId
hbase_rs_flushedCellsSize flush到磁盘的大小 Bytes ComponentId
hbase_rs_Append_mean Append_mean ms ComponentId
hbase_rs_Replay_mean Append_mean ms ComponentId
hbase_rs_Get_mean Append_mean ms ComponentId
hbase_rs_updatesBlockedTime updatesBlockedTime ms ComponentId
hbase_rs_FlushTime_num_ops RS写磁盘次数 次 ComponentId
hbase_rs_splitQueueLength split操作队列请求数 个 ComponentId
hbase_rs_compactionQueueLength compaction操作队列请求数 个 ComponentId
hbase_rs_totalRequestCount 总请求数 次 ComponentId
hbase_rs_readRequestCount 读请求数 次 ComponentId
hbase_rs_writeRequestCount 写请求数 次 ComponentId
hbase_rs_compactedCellsCount 合并cell个数 个 ComponentId
hbase_rs_majorCompactedCellsCount 大合并cell个数 个 ComponentId
hbase_rs_splitRequestCount region分裂请求次数 次 ComponentId
hbase_rs_splitSuccessCount region分裂成功次数 次 ComponentId
hbase_rs_slowGetCount 请求完成时间超过1000ms的次数 次 ComponentId
hbase_rs_authenticationFailures RPC认证失败次数 次 ComponentId
hbase_rs_authenticationSuccesses RPC认证成功次数 次 ComponentId
hbase_rs_numOpenConnections RPC打开的连接数 个 ComponentId
hbase_rs_exceptions_FailedSanityCheckException FailedSanityCheckException 次 ComponentId
hbase_rs_exceptions_NotServingRegionException NotServingRegionException 次 ComponentId
hbase_rs_exceptions_OutOfOrderScannerNextException OutOfOrderScannerNextException 次 ComponentId
hbase_rs_exceptions_RegionMovedException RegionMovedException 次 ComponentId
hbase_rs_exceptions_RegionTooBusyException RegionTooBusyException 次 ComponentId
hbase_rs_exceptions_UnknownScannerException UnknownScannerException 次 ComponentId
hbase_rs_exceptions Exceptions 次 ComponentId
hbase_rs_numActiveHandler RPC句柄数 个 ComponentId
hbase_rs_numCallsInPriorityQueue numCallsInPriorityQueue 个 ComponentId
hbase_rs_numCallsInReplicationQueue numCallsInReplicationQueue 个 ComponentId
hbase_rs_numCallsInGeneralQueue numCallsInGeneralQueue 个 ComponentId
hbase_rs_receivedBytes 接受字节数 Bytes ComponentId
hbase_rs_sentBytes 发送字节数 Bytes ComponentId
hbase_rs_queueSize 排队队列大小 个 ComponentId
hbase_rs_blockCacheSize block缓存大小 Bytes ComponentId
hbase_rs_blockCacheFreeSize block缓存剩余大小 Bytes ComponentId
hbase_rs_blockCacheCount block缓存命中次数 Bytes ComponentId
hbase_rs_blockCacheCountHitPercent block缓存命中率 % ComponentId
hbase_rs_blockCacheExpressHitPercent block缓存打开命中率 % ComponentId
status 进程运行状态 state ComponentId
proc cpu usage 进程cpu利用率 % ComponentId
proc mem usage 进程内存利用率 % ComponentId
jvm gc o jvm gc o % ComponentId
jvm_gc E jvm_gc E % ComponentId
jvm_gc M jvm_gc M % ComponentId
jvm gc ccs jvm gc ccs % ComponentId
jvm gc yGcT jvm gc yGcT % ComponentId
jvm gc FGCT jvm gc FGCT % ComponentId
jvm_gc_GCT jvm_gc_GCT % ComponentId
jvm_gc_YGC jvm_gc_YGC % ComponentId
jvm_gc_FGC jvm_gc_FGC % ComponentId

HBASE_TABLE

表十七 HBASE组件指标说明2

指标英文名称(metric name) 指标中文名称 单位 维度
hbase_tb_tableSize hbase_tableSize Bytes TopicId
hbase_tb_storeFileSize hbase_storeFileSize Bytes TopicId
hbase_tb_readRequestCount hbase_readRequestCount 个 TopicId
hbase_tb_writeRequestCount hbase_writeRequestCount 个 TopicId
hbase_tb_totalRequestCount hbase_totalRequestCount 个 TopicId
hbase_tb_memstoreSize hbase_memstoreSize Bytes TopicId

CLICKHOUSE

CLICKHOUSE_SERVER

表十八 CLICKHOUSE组件监控说明

ck_server_event_InsertQuery ck_event_InsertQuery 次 ComponentId
ck_server_event_InsertedRows ck_event_InsertedRows 条 ComponentId
ck_server_event_DelayedInserts ck_event_DelayedInserts 条 ComponentId
ck_server_event_RejectedInserts ck_event_RejectedInserts 条 ComponentId
ck_server_event_MergedRows ck_event_MergedRows 行 ComponentId
ck_server_metrics_BackgroundPoolTask ck_metrics_BackgroundPoolTask 个 ComponentId
ck_server_metrics_Merge ck_metrics_Merge 次 ComponentId
ck_server_metrics_MemoryTrackingForMerges ck_metrics_MemoryTrackingForMerges bytes ComponentId
ck_server_metrics_PartMutation ck_metrics_PartMutation 个 ComponentId
ck_server_event_Query ck_event_Query 次 ComponentId
ck_server_event_SelectQuery ck_event_SelectQuery 次 ComponentId
ck_server_event_FailedQuery ck_event_FailedQuery 次 ComponentId
ck_server_event_SlowRead ck_event_SlowRead 个 ComponentId
ck_server_metrics_MemoryTracking ck_metrics_MemoryTracking bytes ComponentId
ck_server_event_MarkCacheHits ck_event_MarkCacheHits 个 ComponentId
ck_server_event_MarkCacheMisses ck_event_MarkCacheMisses 个 ComponentId
ck_server_metrics_ReadonlyReplica ck_metrics_ReadonlyReplica 个 ComponentId
ck_server_metrics_ReplicatedFetch ck_metrics_ReplicatedFetch 个 ComponentId
ck_server_metrics_ReplicatedSend ck_metrics_ReplicatedSend 个 ComponentId
ck_server_event_ZooKeeperTransactions ck_event_ZooKeeperTransactions 个 ComponentId
ck_server_metrics_ZooKeeperSession ck_metrics_ZooKeeperSession 个 ComponentId
ck_server_metrics_ZooKeeperWatch ck_metrics_ZooKeeperWatch 个 ComponentId
ck_server_metrics_Query ck_metrics_Query 次 ComponentId
ck_server_metrics_ReplicatedChecks ck_metrics_ReplicatedChecks 个 ComponentId
ck_server_metrics_BackgroundMovePoolTask ck_metrics_BackgroundMovePoolTask 个 ComponentId
ck_server_metrics_BackgroundSchedulePoolTask ck_metrics_BackgroundSchedulePoolTask 个 ComponentId
ck_server_metrics_BackgroundBufferFlushSchedulePoolTask ck_metrics_BackgroundBufferFlushSchedulePoolTask 个 ComponentId
ck_server_metrics_BackgroundDistributedSchedulePoolTask ck_metrics_BackgroundDistributedSchedulePoolTask 个 ComponentId
ck_server_metrics_CacheDictionaryUpdateQueueBatches ck_metrics_CacheDictionaryUpdateQueueBatches 个 ComponentId
ck_server_metrics_CacheDictionaryUpdateQueueKeys ck_metrics_CacheDictionaryUpdateQueueKeys 个 ComponentId
ck_server_metrics_DiskSpaceReservedForMerge ck_metrics_DiskSpaceReservedForMerge bytes ComponentId
ck_server_metrics_DistributedSend ck_metrics_DistributedSend 个 ComponentId
ck_server_metrics_QueryPreempted ck_metrics_QueryPreempted 个 ComponentId
ck_server_metrics_TCPConnection ck_metrics_TCPConnection 个 ComponentId
ck_server_metrics_MySQLConnection ck_metrics_MySQLConnection 个 ComponentId
ck_server_metrics_HTTPConnection ck_metrics_HTTPConnection 个 ComponentId
ck_server_metrics_InterserverConnection ck_metrics_InterserverConnection 个 ComponentId
ck_server_metrics_PostgreSQLConnection ck_metrics_PostgreSQLConnection 个 ComponentId
ck_server_metrics_OpenFileForRead ck_metrics_OpenFileForRead 个 ComponentId
ck_server_metrics_OpenFileForWrite ck_metrics_OpenFileForWrite 个 ComponentId
ck_server_metrics_Read ck_metrics_Read 个 ComponentId
ck_server_metrics_Write ck_metrics_Write 个 ComponentId
ck_server_metrics_SendScalars ck_metrics_SendScalars 个 ComponentId
ck_server_metrics_SendExternalTables ck_metrics_SendExternalTables 个 ComponentId
ck_server_metrics_QueryThread ck_metrics_QueryThread 个 ComponentId
ck_server_metrics_MemoryTrackingInBackgroundProcessingPool ck_metrics_MemoryTrackingInBackgroundProcessingPool bytes ComponentId
ck_server_metrics_MemoryTrackingInBackgroundMoveProcessingPool ck_metrics_MemoryTrackingInBackgroundMoveProcessingPool bytes ComponentId
ck_server_metrics_MemoryTrackingInBackgroundSchedulePool ck_metrics_MemoryTrackingInBackgroundSchedulePool bytes ComponentId
ck_server_metrics_MemoryTrackingInBackgroundBufferFlushSchedulePool ck_metrics_MemoryTrackingInBackgroundBufferFlushSchedulePool bytes ComponentId
ck_server_metrics_MemoryTrackingInBackgroundDistributedSchedulePool ck_metrics_MemoryTrackingInBackgroundDistributedSchedulePool bytes ComponentId
ck_server_metrics_EphemeralNode ck_metrics_EphemeralNode 个 ComponentId
ck_server_metrics_ZooKeeperRequest ck_metrics_ZooKeeperRequest 个 ComponentId
ck_server_metrics_DelayedInserts ck_metrics_DelayedInserts 个 ComponentId
ck_server_metrics_ContextLockWait ck_metrics_ContextLockWait 个 ComponentId
ck_server_metrics_StorageBufferRows ck_metrics_StorageBufferRows 个 ComponentId
ck_server_metrics_StorageBufferBytes ck_metrics_StorageBufferBytes bytes ComponentId
ck_server_metrics_DictCacheRequests ck_metrics_DictCacheRequests 个 ComponentId
ck_server_metrics_Revision ck_metrics_Revision 个 ComponentId
ck_server_metrics_VersionInteger ck_metrics_VersionInteger 版本 ComponentId
ck_server_metrics_RWLockWaitingReaders ck_metrics_RWLockWaitingReaders 个 ComponentId
ck_server_metrics_RWLockWaitingWriters ck_metrics_RWLockWaitingWriters 个 ComponentId
ck_server_metrics_RWLockActiveReaders ck_metrics_RWLockActiveReaders 个 ComponentId
ck_server_metrics_RWLockActiveWriters ck_metrics_RWLockActiveWriters 个 ComponentId
ck_server_metrics_GlobalThread ck_metrics_GlobalThread 个 ComponentId
ck_server_metrics_GlobalThreadActive ck_metrics_GlobalThreadActive 个 ComponentId
ck_server_metrics_LocalThread ck_metrics_LocalThread 个 ComponentId
ck_server_metrics_LocalThreadActive ck_metrics_LocalThreadActive 个 ComponentId
ck_server_metrics_DistributedFilesToInsert ck_metrics_DistributedFilesToInsert 个 ComponentId
ck_server_event_FailedSelectQuery ck_event_FailedSelectQuery 次 ComponentId
ck_server_event_FailedInsertQuery ck_event_FailedInsertQuery 次 ComponentId
ck_event_FileOpen ck_event_FileOpen 个 ComponentId
ck_server_event_Seek ck_event_Seek 次 ComponentId
ck_server_event_ReadBufferFromFileDescriptorRead ck_event_ReadBufferFromFileDescriptorRead 个 ComponentId
ck_server_event_ReadBufferFromFileDescriptorReadBytes ck_event_ReadBufferFromFileDescriptorReadBytes bytes ComponentId
ck_server_event_WriteBufferFromFileDescriptorWrite ck_event_WriteBufferFromFileDescriptorWrite 个 ComponentId
ck_server_event_WriteBufferFromFileDescriptorWriteFailed ck_event_WriteBufferFromFileDescriptorWriteFailed 个 ComponentId
ck_server_event_WriteBufferFromFileDescriptorWriteBytes ck_event_WriteBufferFromFileDescriptorWriteBytes bytes ComponentId
ck_server_event_ReadCompressedBytes ck_event_ReadCompressedBytes bytes ComponentId
ck_server_event_CompressedReadBufferBlocks ck_event_CompressedReadBufferBlocks 个 ComponentId
ck_server_event_CompressedReadBufferBytes ck_event_CompressedReadBufferBytes bytes ComponentId
ck_server_event_IOBufferAllocs ck_event_IOBufferAllocs 个 ComponentId
ck_server_event_IOBufferAllocBytes ck_event_IOBufferAllocBytes bytes ComponentId
ck_server_event_ArenaAllocChunks ck_event_ArenaAllocChunks 个 ComponentId
ck_server_event_ArenaAllocBytes ck_event_ArenaAllocBytes bytes ComponentId
ck_server_event_FunctionExecute ck_event_FunctionExecute 个 ComponentId
ck_server_event_TableFunctionExecute ck_event_TableFunctionExecute 个 ComponentId
ck_server_event_CreatedReadBufferOrdinary ck_event_CreatedReadBufferOrdinary 个 ComponentId
ck_server_event_DiskReadElapsedMicroseconds ck_event_DiskReadElapsedMicroseconds μs ComponentId
ck_server_event_DiskWriteElapsedMicroseconds ck_event_DiskWriteElapsedMicroseconds μs ComponentId
ck_server_event_NetworkReceiveElapsedMicroseconds ck_event_NetworkReceiveElapsedMicroseconds μs ComponentId
ck_server_event_NetworkSendElapsedMicroseconds ck_event_NetworkSendElapsedMicroseconds μs ComponentId
ck_server_event_ReplicatedPartFetches ck_event_ReplicatedPartFetches 个 ComponentId
ck_server_event_ReplicatedPartMerges ck_event_ReplicatedPartMerges 个 ComponentId
ck_server_event_InsertedBytes ck_event_InsertedBytes bytes ComponentId
ck_server_event_DelayedInsertsMilliseconds ck_event_DelayedInsertsMilliseconds ms ComponentId
ck_server_event_ZooKeeperInit ck_event_ZooKeeperInit 个 ComponentId
ck_server_event_ZooKeeperList ck_event_ZooKeeperList 个 ComponentId
ck_server_event_ZooKeeperCreate ck_event_ZooKeeperCreate 个 ComponentId
ck_server_event_ZooKeeperWaitMicroseconds ck_event_ZooKeeperWaitMicroseconds μs ComponentId
ck_server_event_ZooKeeperBytesSent ck_event_ZooKeeperBytesSent bytes ComponentId
ck_server_event_ZooKeeperBytesReceived ck_event_ZooKeeperBytesReceived bytes ComponentId
ck_server_event_ReadBackoff ck_event_ReadBackoff 个 ComponentId
ck_server_event_ReplicaPartialShutdown ck_event_ReplicaPartialShutdown 个 ComponentId
ck_server_event_SelectedParts ck_event_SelectedParts 个 ComponentId
ck_server_event_SelectedRanges ck_event_SelectedRanges 个 ComponentId
ck_server_event_SelectedMarks ck_event_SelectedMarks 个 ComponentId
ck_server_event_Merge ck_event_Merge 次 ComponentId
ck_server_event_MergedUncompressedBytes ck_event_MergedUncompressedBytes bytes ComponentId
ck_server_event_MergesTimeMilliseconds ck_event_MergesTimeMilliseconds ms ComponentId
ck_server_event_MergeTreeDataWriterRows ck_event_MergeTreeDataWriterRows 行 ComponentId
ck_server_event_MergeTreeDataWriterUncompressedBytes ck_event_MergeTreeDataWriterUncompressedBytes bytes ComponentId
ck_server_event_MergeTreeDataWriterCompressedBytes ck_event_MergeTreeDataWriterCompressedBytes bytes ComponentId
ck_server_event_MergeTreeDataWriterBlocks ck_event_MergeTreeDataWriterBlocks 个 ComponentId
ck_server_event_MergeTreeDataWriterBlocksAlreadySorted ck_event_MergeTreeDataWriterBlocksAlreadySorted 个 ComponentId
ck_server_event_CannotRemoveEphemeralNode ck_event_CannotRemoveEphemeralNode 个 ComponentId
ck_server_event_RegexpCreated ck_event_RegexpCreated 个 ComponentId
ck_server_event_ContextLock ck_event_ContextLock 个 ComponentId
ck_server_event_RWLockAcquiredReadLocks ck_event_RWLockAcquiredReadLocks 个 ComponentId
ck_server_event_RWLockAcquiredWriteLocks ck_event_RWLockAcquiredWriteLocks 个 ComponentId
ck_server_event_RWLockReadersWaitMilliseconds ck_event_RWLockReadersWaitMilliseconds ms ComponentId
ck_server_event_RealTimeMicroseconds ck_event_RealTimeMicroseconds μs ComponentId
ck_server_event_UserTimeMicroseconds ck_event_UserTimeMicroseconds μs ComponentId
ck_server_event_SystemTimeMicroseconds ck_event_SystemTimeMicroseconds μs ComponentId
ck_server_event_SoftPageFaults ck_event_SoftPageFaults 个 ComponentId
ck_server_event_OSIOWaitMicroseconds ck_event_OSIOWaitMicroseconds μs ComponentId
ck_server_event_OSCPUWaitMicroseconds ck_event_OSCPUWaitMicroseconds μs ComponentId
ck_server_event_OSCPUVirtualTimeMicroseconds ck_event_OSCPUVirtualTimeMicroseconds 个 ComponentId
ck_server_event_OSReadBytes ck_event_OSReadBytes bytes ComponentId
ck_server_event_OSWriteBytes ck_event_OSWriteBytes bytes ComponentId
ck_server_event_OSReadChars ck_event_OSReadChars 个 ComponentId
ck_server_event_OSWriteChars ck_event_OSWriteChars 个 ComponentId
ck_server_event_CreatedHTTPConnections ck_event_CreatedHTTPConnections 个 ComponentId
ck_server_event_QueryProfilerSignalOverruns ck_event_QueryProfilerSignalOverruns 个 ComponentId
ck_server_event_CreatedLogEntryForMerge ck_event_CreatedLogEntryForMerge 个 ComponentId
ck_server_async_metrics_NumberOfTables ck_async_metrics_NumberOfTables 个 ComponentId
ck_server_async_metrics_NumberOfDatabases ck_async_metrics_NumberOfDatabases 个 ComponentId
ck_server_async_metrics_MaxPartCountForPartition ck_async_metrics_MaxPartCountForPartition 个 ComponentId
ck_server_async_metrics_ReplicasSumQueueSize ck_async_metrics_ReplicasSumQueueSize 个 ComponentId
ck_server_async_metrics_ReplicasMaxMergesInQueue ck_async_metrics_ReplicasMaxMergesInQueue 个 ComponentId
ck_server_async_metrics_MemoryShared ck_async_metrics_MemoryShared bytes ComponentId
ck_server_async_metrics_MemoryCode ck_async_metrics_MemoryCode bytes ComponentId
ck_server_async_metrics_ReplicasMaxAbsoluteDelay ck_async_metrics_ReplicasMaxAbsoluteDelay 个 ComponentId
ck_server_async_metrics_ReplicasMaxQueueSize ck_async_metrics_ReplicasMaxQueueSize 个 ComponentId
ck_server_async_metrics_MemoryVirtual ck_async_metrics_MemoryVirtual bytes ComponentId
ck_server_async_metrics_MarkCacheBytes ck_async_metrics_MarkCacheBytes bytes ComponentId
ck_server_async_metrics_CompiledExpressionCacheCount ck_async_metrics_CompiledExpressionCacheCount 个 ComponentId
ck_server_async_metrics_ReplicasSumMergesInQueue ck_async_metrics_ReplicasSumMergesInQueue 个 ComponentId
ck_server_async_metrics_UncompressedCacheBytes ck_async_metrics_UncompressedCacheBytes 个 ComponentId
ck_async_metrics_ReplicasSumInsertsInQueue ck_async_metrics_ReplicasSumInsertsInQueue 个 ComponentId
ck_server_async_metrics_MarkCacheFiles ck_async_metrics_MarkCacheFiles 个 ComponentId
ck_server_async_metrics_MemoryDataAndStack ck_async_metrics_MemoryDataAndStack bytes ComponentId
ck_server_async_metrics_MemoryResident ck_async_metrics_MemoryResident bytes ComponentId
ck_server_async_metrics_ReplicasMaxInsertsInQueue ck_async_metrics_ReplicasMaxInsertsInQueue 个 ComponentId
ck_server_async_metrics_ReplicasMaxRelativeDelay ck_async_metrics_ReplicasMaxRelativeDelay 个 ComponentId
ck_server_async_metrics_UncompressedCacheCells ck_async_metrics_UncompressedCacheCells 个 ComponentId

IMPALA

IMPALA_CATALOG

表十九 IMPALA组件监控指标说明1

指标英文名称(metric name) 指标中文名称 单位 维度
impala_catalog_impala_thrift_server_CatalogService_connections_in_use 当前活跃连接数 个 ComponentId
impala_catalog_thread_manager_total_threads_created catalogd进程线程创建数量 个 ComponentId
impala_catalog_memory_total_used catalogd进程内存总使用量 byte ComponentId
impala_catalog_memory_rss catalogd进程物理内存使用量 byte ComponentId

IMPALA_STATE_STORE

表二十 IMPALA组件监控指标说明2

指标英文名称(metric name) 指标中文名称 单位 维度
impala_statestore_thread_manager_total_threads_created statestored进程线程创建数量 个 ComponentId
impala_statestore_memory_total_used statestored进程内存总使用量 byte ComponentId
impala_statestore_memory_rss statestored进程物理内存使用量 byte ComponentId

IMPALA_IMPALAD

表二十一 IMPALA组件监控指标说明3

指标英文名称(metric name) 指标中文名称 单位 维度
impalad_metrics_impala_server_query_durations_ms_90th 已完成查询操作耗时时间的90分位点 ms ComponentId
impalad_metrics_impala_server_query_durations_ms_99_9th 已完成查询操作耗时时间的99.9分位点 ms ComponentId
impalad_metrics_impala_server_ddl_durations_ms_90th 已完成DDL操作耗时时间的90分位点 ms ComponentId
impalad_metrics_impala_server_ddl_durations_ms_99_9th 已完成DDL操作耗时时间的99分位点 ms ComponentId
impalad_metrics_impala_thrift_server_backend_connections_in_use ThriftServer后端当前活跃连接数 个 ComponentId
impalad_metrics_thread_manager_total_threads_created impalad进程线程创建数量 个 ComponentId
impalad_metrics_memory_total_used impalad进程内存总使用量 byte ComponentId
impalad_metrics_impala_server_num_fragments 已完成fragment总数 个 ComponentId

KUDU

KUDU_TSERVER

表二十二 KUDU组件监控指标说明1

指标英文名称(metric name) 指标中文名称 单位 维度
kudu_tserver_inbound_connections_socket_stats_pacing_rate_max tserver网络传入每毫秒流量最大值 kps ComponentId
kudu_tserver_inbound_connections_socket_stats_pacing_rate_min tserver网络传入每毫秒流量最小值 kps ComponentId
kudu_tserver_inbound_connections_socket_stats_rtt_max tserver网络传入往返时间最大值 ms ComponentId
kudu_tserver_inbound_connections_socket_stats_rtt_min tserver网络传入往返时间最小值 ms ComponentId
kudu_tserver_inbound_connections_socket_stats_rttvar_max tserver网络传入往返时间平均偏差最大值 ms ComponentId
kudu_tserver_inbound_connections_socket_stats_rttvar_min tserver网络传入往返时间平均偏差最小值 ms ComponentId
kudu_tserver_outbound_connections_socket_stats_pacing_rate_max tserver网络传出每毫秒流量最大值 kps ComponentId
kudu_tserver_outbound_connections_socket_stats_pacing_rate_min tserver网络传出每毫秒流量最小值 kps ComponentId
kudu_tserver_outbound_connections_socket_stats_rtt_max tserver网络传出往返时间最大值 ms ComponentId
kudu_tserver_outbound_connections_socket_stats_rtt_min tserver网络传出往返时间最小值 ms ComponentId
kudu_tserver_outbound_connections_socket_stats_rttvar_max tserver网络传出往返时间平均偏差最大值 ms ComponentId
kudu_tserver_outbound_connections_socket_stats_rttvar_min tserver网络传出往返时间平均偏差最小值 ms ComponentId
kudu_tserver_active_scanners 处于active状态的scanner数量 个 ComponentId
kudu_tserver_block_cache_usage tserver进程块缓存占用的内存 byte ComponentId
kudu_tserver_cpu_stime tserver进程的总系统 CPU 时间 s ComponentId
kudu_tserver_cpu_utime tserver进程的用户 CPU 总时间 s ComponentId
kudu_tserver_glog_error_messages tserver进程中发出的 ERROR 级日志消息数 次 ComponentId
kudu_tserver_memrowset_size 内存中存储行 行 ComponentId
kudu_tserver_num_rowsets_on_disk 硬盘中存储行 行 ComponentId
kudu_tserver_op_apply_queue_length_percentile_99 操作队列长度的99分位数 个 ComponentId
kudu_tserver_op_apply_queue_time_percentile_99 操作在队列的等待时间的99分位数 ms ComponentId
kudu_tserver_op_apply_run_time_percentile_99 操作执行时间的99分位数 ms ComponentId
kudu_tserver_reactor_load_percent_percentile_99 reactor线程负载的99分位数 个 ComponentId
kudu_tserver_rows_deleted 节点删除 Row 的数量 行 ComponentId
kudu_tserver_rows_inserted 节点插入 Row 的数量 行 ComponentId
kudu_tserver_rows_updated 节点更新 Row 的数量 行 ComponentId
kudu_tserver_rows_upserted 节点 Upserted Row 的数量 行 ComponentId
kudu_tserver_scanner_duration_percentile_99 scanner耗费时间的99分位数 ms ComponentId
kudu_tserver_tablets_num_failed 失败的 tablet 个数 个 ComponentId
kudu_tserver_tablets_num_running 当前正在运行的 tablet 个数 个 ComponentId
kudu_tserver_tablets_num_shutdown 当前关闭的 tablet 个数 个 ComponentId
kudu_tserver_tablets_num_stopped 当前停止的 tablet 个数 个 ComponentId
kudu_tserver_tcmalloc_current_total_thread_cache_bytes tserver线程TCMalloc正在使用的内存 byte ComponentId
kudu_tserver_threads_running tablet server线程数 个 ComponentId
status 进程运行状态 状态
proc_cpu_usage 进程cpu利用率 %
proc_mem_usage 进程内存利用率 %

KUDU_MASTER

表二十三 KUDU组件监控指标说明2

指标英文名称(metric name) 指标中文名称 单位 维度
kudu_master_data_dirs_failed 失败的数据目录个数 个 ComponentId
kudu_master_data_dirs_full full状态的数据目录个数 个 ComponentId
kudu_master_glog_error_messages master进程中发出的 ERROR 级日志消息数 次 ComponentId
kudu_master_glog_warning_messages master进程中发出的 WARNING 级日志消息数 次 ComponentId
kudu_master_rpc_connections_accepted master进程RPC请求接收的数量 个 ComponentId
kudu_master_rpc_incoming_queue_time_percentile_99 master进程RPC队列的等待时间的99分位数 ms ComponentId
kudu_master_rpcs_queue_overflow master进程RPC队列溢出次数 次 ComponentId
kudu_master_rpcs_timed_out_in_queue master进程RPC等待超时 ms ComponentId
kudu_master_threads_running master 线程数 个 ComponentId
kudu_master_inbound_connections_socket_stats_pacing_rate_max master进程网络传入每毫秒流量最大值 kps ComponentId
kudu_master_inbound_connections_socket_stats_pacing_rate_min master进程网络传入每毫秒流量最小值 kps ComponentId
kudu_master_inbound_connections_socket_stats_rtt_max master进程网络传入每毫秒流量最小值 ms ComponentId
kudu_master_inbound_connections_socket_stats_rtt_min master进程网络传入往返时间最小值 ms ComponentId
kudu_master_inbound_connections_socket_stats_rttvar_max master进程网络传入往返时间平均偏差最大值 ms ComponentId
kudu_master_inbound_connections_socket_stats_rttvar_min master进程网络传入往返时间平均偏差最小值 ms ComponentId
kudu_master_outbound_connections_socket_stats_pacing_rate_max master进程网络传出每毫秒流量最大值 kps ComponentId
kudu_master_outbound_connections_socket_stats_pacing_rate_min master进程网络传出每毫秒流量最小值 kps ComponentId
kudu_master_outbound_connections_socket_stats_rtt_max master进程网络传出往返时间最大值 ms ComponentId
kudu_master_outbound_connections_socket_stats_rtt_min master进程网络传出往返时间最小值 ms ComponentId
kudu_master_outbound_connections_socket_stats_rttvar_max master进程网络传出往返时间平均偏差最大值 ms ComponentId
kudu_master_outbound_connections_socket_stats_rttvar_min master进程网络传出往返时间平均偏差最小值 ms ComponentId

上一篇
监控报警
下一篇
资源管理