节点组管理

容器引擎 CCE

  • 功能发布记录
  • 产品描述
    • 介绍
    • 优势
    • 使用限制
    • 应用场景
    • 核心概念
    • 特性
  • 开发指南
    • EFK日志采集系统部署指南
    • 创建LoadBalancer类型的Service
    • Prometheus监控系统部署指南
    • kubectl管理配置
    • 在CCE集群中使用-Network-Policy
  • 常用工具
    • 视图命令行场景示例
  • 产品公告
    • CCE 新版集群管理发布公告
    • CCE 控制台升级公告
    • Kubernetes 版本发布说明
      • CCE发布Kubernetes 1.18版本说明
      • CCE发布Kubernetes 1.30版本说明
      • CCE Kubernetes 版本更新说明
      • CCE发布Kubernetes 1.22版本说明
      • CCE发布Kubernetes 1.20版本说明
      • CCE发布Kubernetes 1.28版本说明
      • CCE发布Kubernetes 1.24版本说明
      • CCE发布Kubernetes 1.26版本说明
    • 安全漏洞修复公告
      • 漏洞CVE-2020-14386修复公告
      • 修复漏洞CVE-2021-30465公告
      • 漏洞CVE-2019-5736修复公告
      • 漏洞CVE-2025-1097、CVE-2025-1098等修复公告
      • 关于 runc 的安全问题(CVE-2024-21626)影响声明
  • 快速入门
    • 快速部署nginx应用
    • 使用CCE容器引擎流程概述
  • 典型实践
    • CCE集群网络说明及规划
    • CCE典型实践之容器网络模式选择
    • Pod异常问题排查
    • 通过 CCE Ingress 实现虚机和容器服务的统一接入
    • CCE集群使用Jenkins持续发布
    • CCE-访问公网实践
    • Linux系统配置常用参数说明
    • 用户使用自定义 CNI 插件方法
    • CCE典型实践之Guestbook搭建
    • 使用KMS对etcd数据加密
    • 添加CGroup V2节点
    • CCE容器运行时选择
    • CCE使用检查清单
    • VPC-ENI模式集群访问公网实践
    • 利用 Velero 实现将应用跨云迁移到 百度CCE
    • 使用 CNI 配置容器内网络参数
    • CCE Resource Recommender 用户文档
    • CCE集群中使用私有镜像实践
    • 云原生AI
      • 使用 CCE AITraining Operator 实现弹性容错训练
      • 部署 TensorFlow Serving 推理服务
      • GPU虚拟化之隔离性最优型的最佳实践
  • 操作指南
    • 多用户访问控制
    • 使用须知
    • 命名空间管理
      • 设置资源配额
      • 设置资源限制
      • 命名空间基本操作
    • 弹性伸缩
      • 使用 cce-autoscaling-placeholder 实现秒级弹性伸缩
      • CCE 集群节点自动伸缩
      • 容器定时水平伸缩(CronHPA)
      • 容器水平伸缩(HPA)
    • 存储管理
      • 使用云盘CDS
      • 使用并行文件存储PFS
      • 使用对象存储BOS
      • 使用并行文件存储PFS L2
      • 使用本地存储
      • 使用数据湖存储加速工具RapidFS
      • 使用文件存储CFS
      • 概述
    • 节点管理
      • 移出节点
      • kubelet容器监控只读端口风险提示
      • 管理污点
      • 设置GPU显存共享
      • 添加节点
      • 自定义Kubelet参数
      • 设置节点封锁
      • 节点排水
      • 管理节点标签
    • 组件管理
      • CCE CSI BOS Plugin 说明
      • Kube Scheduler 说明文档
      • CCE CSI PFS L2 Plugin
      • CCE NodeLocal DNSCache 说明
      • CCE Ingress NGINX Controller 说明
      • CCE RDMA Device Plugin 说明
      • CCE Node Problem Detector 说明
      • CCE Credential Controller 说明
      • Kube Controller Manager 说明
      • CCE Ingress Controller 说明
      • CCE GPU Manager 说明
      • CCE Backup Controller 说明
      • CCE QoS Agent 说明
      • CCE Descheduler 说明
      • 组件概述
      • CCE Image Accelerate 说明
      • CCE Network Plugin说明
      • Kube ApiServer 说明
      • CCE Log Operator 说明
      • CoreDNS 说明
      • CCE NPU Manager 说明
      • CCE AI Job Scheduler 说明
      • CCE LB Controller 说明
      • CCE P2P Accelerator 说明
      • CCE_Hybrid_Manager说明
      • CCE CSI PFS Plugin 说明
      • CCE Deep Learning Frameworks Operator 说明
      • CCE Node Remedier 说明
      • CCE CSI CDS Plugin 说明
      • CCE Ascend Mindx DL说明
      • CCE Calico Felix 说明
      • CCE Virtual Kubelet组件
      • CCE Fluid说明
      • CCE Onepilot 说明
      • CCE CronHPA Controller 说明
      • CCE 动态调度插件说明
    • 云原生AI
      • 云原生AI概述
      • GPU虚拟化
        • MPS 最佳实践&注意事项
        • GPU独占和共享说明
        • GPU在离线混部使用说明
        • GPU虚拟化适配表
        • 单GPU容器共享多卡使用说明
        • 共享GPU场景下的镜像构建注意事项
        • 关闭节点显存共享功能注意事项
      • 队列管理
        • 逻辑队列和物理队列使用说明
        • 修改队列
        • 删除队列
        • 新建队列
      • 任务管理
        • 基于 NCCL的RDMA分布式训练示例
        • 新建AITraining任务
        • 新建PaddlePaddle任务
        • 删除任务
        • 查看任务信息
        • 新建Mxnet任务
        • 新建TensorFlow任务
        • 新建Pytorch任务
      • 数据集管理
        • 删除数据集
        • 操作数据集
        • 查看数据集
        • 新建数据集
      • AI监控大盘
        • 接入监控实例并开启采集任务
        • NVIDIA芯片资源观测
          • AI Job Scheduler组件
          • GPUManager组件
          • GPU资源池总览
          • GPU节点资源
          • GPU工作负载资源
        • 昇腾芯片资源观测
          • 昇腾节点资源
          • 昇腾资源池总览
          • 昇腾工作负载资源
      • AI 加速套件
        • 使用AIAK-Inference 加速推理业务
        • 使用AIAK-Training Pytorch版
        • AIAK 简介
        • 使用 AIAK-Training 部署分布式训练任务
    • Helm管理
      • Helm模板
      • Helm实例
    • 应用管理
      • 部署
      • 保密字典
      • 服务
      • 配置字典
      • 容器组
      • 概述
    • 镜像仓库
      • 使用容器镜像构建服务
      • 镜像仓库基本操作
    • Serverless集群
      • 在Serverless集群中使用Service
      • 产品概述
      • 创建Serverless集群
    • 工作负载
      • 设置工作负载自动水平伸缩
      • Statefulset管理
      • 使用私有镜像创建工作负载
      • Job管理
      • 查看容器组
      • CronJob管理
      • Daemonset管理
      • 免密拉取容器镜像
      • Deployment管理
    • 节点组管理
      • 节点组管理
      • 节点组介绍
      • 升级节点组
      • 添加外部已有节点
      • 自定义节点组 Kubelet 配置
      • 添加备选机型
      • 节点组节点故障检测自愈
      • 配置扩缩容策略
    • 监控日志
      • 使用Prometheus监控集群
      • CCE 事件中心
      • 集群审计仪表盘
      • CCE 集群异常事件报警
      • Java应用监控
      • 集群服务画像
      • 日志管理
      • 集群审计
      • 日志中心
        • 在容器引擎控制台配置采集规则
        • 查看集群控制面日志
        • 日志概述
        • 查看业务日志
        • 使用CRD配置采集规则
    • 网络管理
      • CCE 集群内容器访问集群外服务
      • 容器网段空间耗尽如何继续扩容(VPC-ENI模式)
      • 容器网段空间耗尽如何继续扩容(VPC网络模式)
      • CCE IP Masquerade Agent 用户指南
      • 创建VPC-ENI模式集群
      • 对等连接场景下容器流量转发配置
      • 使用Network Policy网络策略
      • CCE 支持 IPv4 和 IPv6 双栈网络
      • 在CCE集群中使用NetworkPolicy
      • 网络编排
        • 集群 Pod 子网拓扑分布(容器网络 v2)
        • 容器网络 QoS 管理
        • VPC-ENI指定子网分配IP(容器网络 v2)
      • 网络连通性
        • 容器网络通过 NAT 网关访问公网
      • 网络维护
        • CCE容器网络常见错误码对应表
      • DNS
        • DNS 原理概述
        • DNS 问题排查指南
        • CoreDNS 组件手动升级指南
    • 虚拟节点
      • 管理虚拟节点
      • 配置BCIPod
      • 配置bci-profile
    • 备份中心
      • 备份概述
      • 恢复管理
      • 备份仓库
      • 备份管理
    • 巡检与诊断
      • GPU运行环境检查
      • 集群巡检
      • 故障诊断
    • 流量接入
      • NGINX Ingress 使用配置参考
      • CCE基于nginx-ingress实现灰度发布
      • BLB Ingress Annotation说明
      • 通过CCE使用K8S_Ingress
      • 通过YAML创建LoadBalancer_Service
      • 通过CCE使用K8S_Service
      • LoadBalancer Service Annotation说明
      • 使用直连 Pod 模式 LoadBalancer Service
      • Service复用已有负载均衡BLB
      • 通过YAML创建CCE_Ingress
      • 使用 NGINX Ingress
    • 权限管理
      • 配置集群OIDC认证
      • 配置IAM标签权限策略
      • 配置IAM自定义权限策略
      • 配置IAM预置权限策略
      • 权限概述
      • 配置预置RBAC权限策略
    • 配置管理
      • Secret管理
      • Configmap管理
    • 集群管理
      • 集群快照
      • CCE 安全组
      • 查看集群
      • 创建集群
      • 操作集群
      • 升级集群Kubernetes版本
      • 通过kubectl连接集群
      • 托管集群使用说明
      • CCE 支持 GPUSharing 集群
      • CCE节点资源预留说明
      • CCE 节点 CDS 扩容
  • 服务等级协议SLA
    • CCE服务等级协议SLA(V1.0)
  • Solution-Fabric
    • Fabric解决方案
  • API参考
    • 通用说明
    • 公共头和错误返回
    • 概述
  • 常见问题
    • windows下使用kubectl
    • 自动扩缩容常见问题
    • 通过kubectl创建简单的服务
    • 业务应用如何使用负载均衡?
    • 常见问题总览
    • 集群管理常见问题
  • API_V2参考
    • 通用说明
    • Instance相关接口
    • 附录
    • Autoscaler相关接口
    • 组件管理相关接口
    • 套餐适配相关接口
    • Task相关接口
    • 公共头和错误返回
    • Network相关接口
    • 服务域名
    • Cluster相关接口
    • Kubeconfig相关接口
    • InstanceGroup相关接口
    • RBAC相关接口
    • 概述
  • 产品定价
    • 产品定价
  • Solution-Xchain
    • 超级链解决方案
  • SDK
    • Go-SDK
      • 节点组管理
      • 节点管理
      • 集群管理
      • 初始化
      • 安装SDK工具包
      • 概述
所有文档
menu
没有找到结果,请重新输入

容器引擎 CCE

  • 功能发布记录
  • 产品描述
    • 介绍
    • 优势
    • 使用限制
    • 应用场景
    • 核心概念
    • 特性
  • 开发指南
    • EFK日志采集系统部署指南
    • 创建LoadBalancer类型的Service
    • Prometheus监控系统部署指南
    • kubectl管理配置
    • 在CCE集群中使用-Network-Policy
  • 常用工具
    • 视图命令行场景示例
  • 产品公告
    • CCE 新版集群管理发布公告
    • CCE 控制台升级公告
    • Kubernetes 版本发布说明
      • CCE发布Kubernetes 1.18版本说明
      • CCE发布Kubernetes 1.30版本说明
      • CCE Kubernetes 版本更新说明
      • CCE发布Kubernetes 1.22版本说明
      • CCE发布Kubernetes 1.20版本说明
      • CCE发布Kubernetes 1.28版本说明
      • CCE发布Kubernetes 1.24版本说明
      • CCE发布Kubernetes 1.26版本说明
    • 安全漏洞修复公告
      • 漏洞CVE-2020-14386修复公告
      • 修复漏洞CVE-2021-30465公告
      • 漏洞CVE-2019-5736修复公告
      • 漏洞CVE-2025-1097、CVE-2025-1098等修复公告
      • 关于 runc 的安全问题(CVE-2024-21626)影响声明
  • 快速入门
    • 快速部署nginx应用
    • 使用CCE容器引擎流程概述
  • 典型实践
    • CCE集群网络说明及规划
    • CCE典型实践之容器网络模式选择
    • Pod异常问题排查
    • 通过 CCE Ingress 实现虚机和容器服务的统一接入
    • CCE集群使用Jenkins持续发布
    • CCE-访问公网实践
    • Linux系统配置常用参数说明
    • 用户使用自定义 CNI 插件方法
    • CCE典型实践之Guestbook搭建
    • 使用KMS对etcd数据加密
    • 添加CGroup V2节点
    • CCE容器运行时选择
    • CCE使用检查清单
    • VPC-ENI模式集群访问公网实践
    • 利用 Velero 实现将应用跨云迁移到 百度CCE
    • 使用 CNI 配置容器内网络参数
    • CCE Resource Recommender 用户文档
    • CCE集群中使用私有镜像实践
    • 云原生AI
      • 使用 CCE AITraining Operator 实现弹性容错训练
      • 部署 TensorFlow Serving 推理服务
      • GPU虚拟化之隔离性最优型的最佳实践
  • 操作指南
    • 多用户访问控制
    • 使用须知
    • 命名空间管理
      • 设置资源配额
      • 设置资源限制
      • 命名空间基本操作
    • 弹性伸缩
      • 使用 cce-autoscaling-placeholder 实现秒级弹性伸缩
      • CCE 集群节点自动伸缩
      • 容器定时水平伸缩(CronHPA)
      • 容器水平伸缩(HPA)
    • 存储管理
      • 使用云盘CDS
      • 使用并行文件存储PFS
      • 使用对象存储BOS
      • 使用并行文件存储PFS L2
      • 使用本地存储
      • 使用数据湖存储加速工具RapidFS
      • 使用文件存储CFS
      • 概述
    • 节点管理
      • 移出节点
      • kubelet容器监控只读端口风险提示
      • 管理污点
      • 设置GPU显存共享
      • 添加节点
      • 自定义Kubelet参数
      • 设置节点封锁
      • 节点排水
      • 管理节点标签
    • 组件管理
      • CCE CSI BOS Plugin 说明
      • Kube Scheduler 说明文档
      • CCE CSI PFS L2 Plugin
      • CCE NodeLocal DNSCache 说明
      • CCE Ingress NGINX Controller 说明
      • CCE RDMA Device Plugin 说明
      • CCE Node Problem Detector 说明
      • CCE Credential Controller 说明
      • Kube Controller Manager 说明
      • CCE Ingress Controller 说明
      • CCE GPU Manager 说明
      • CCE Backup Controller 说明
      • CCE QoS Agent 说明
      • CCE Descheduler 说明
      • 组件概述
      • CCE Image Accelerate 说明
      • CCE Network Plugin说明
      • Kube ApiServer 说明
      • CCE Log Operator 说明
      • CoreDNS 说明
      • CCE NPU Manager 说明
      • CCE AI Job Scheduler 说明
      • CCE LB Controller 说明
      • CCE P2P Accelerator 说明
      • CCE_Hybrid_Manager说明
      • CCE CSI PFS Plugin 说明
      • CCE Deep Learning Frameworks Operator 说明
      • CCE Node Remedier 说明
      • CCE CSI CDS Plugin 说明
      • CCE Ascend Mindx DL说明
      • CCE Calico Felix 说明
      • CCE Virtual Kubelet组件
      • CCE Fluid说明
      • CCE Onepilot 说明
      • CCE CronHPA Controller 说明
      • CCE 动态调度插件说明
    • 云原生AI
      • 云原生AI概述
      • GPU虚拟化
        • MPS 最佳实践&注意事项
        • GPU独占和共享说明
        • GPU在离线混部使用说明
        • GPU虚拟化适配表
        • 单GPU容器共享多卡使用说明
        • 共享GPU场景下的镜像构建注意事项
        • 关闭节点显存共享功能注意事项
      • 队列管理
        • 逻辑队列和物理队列使用说明
        • 修改队列
        • 删除队列
        • 新建队列
      • 任务管理
        • 基于 NCCL的RDMA分布式训练示例
        • 新建AITraining任务
        • 新建PaddlePaddle任务
        • 删除任务
        • 查看任务信息
        • 新建Mxnet任务
        • 新建TensorFlow任务
        • 新建Pytorch任务
      • 数据集管理
        • 删除数据集
        • 操作数据集
        • 查看数据集
        • 新建数据集
      • AI监控大盘
        • 接入监控实例并开启采集任务
        • NVIDIA芯片资源观测
          • AI Job Scheduler组件
          • GPUManager组件
          • GPU资源池总览
          • GPU节点资源
          • GPU工作负载资源
        • 昇腾芯片资源观测
          • 昇腾节点资源
          • 昇腾资源池总览
          • 昇腾工作负载资源
      • AI 加速套件
        • 使用AIAK-Inference 加速推理业务
        • 使用AIAK-Training Pytorch版
        • AIAK 简介
        • 使用 AIAK-Training 部署分布式训练任务
    • Helm管理
      • Helm模板
      • Helm实例
    • 应用管理
      • 部署
      • 保密字典
      • 服务
      • 配置字典
      • 容器组
      • 概述
    • 镜像仓库
      • 使用容器镜像构建服务
      • 镜像仓库基本操作
    • Serverless集群
      • 在Serverless集群中使用Service
      • 产品概述
      • 创建Serverless集群
    • 工作负载
      • 设置工作负载自动水平伸缩
      • Statefulset管理
      • 使用私有镜像创建工作负载
      • Job管理
      • 查看容器组
      • CronJob管理
      • Daemonset管理
      • 免密拉取容器镜像
      • Deployment管理
    • 节点组管理
      • 节点组管理
      • 节点组介绍
      • 升级节点组
      • 添加外部已有节点
      • 自定义节点组 Kubelet 配置
      • 添加备选机型
      • 节点组节点故障检测自愈
      • 配置扩缩容策略
    • 监控日志
      • 使用Prometheus监控集群
      • CCE 事件中心
      • 集群审计仪表盘
      • CCE 集群异常事件报警
      • Java应用监控
      • 集群服务画像
      • 日志管理
      • 集群审计
      • 日志中心
        • 在容器引擎控制台配置采集规则
        • 查看集群控制面日志
        • 日志概述
        • 查看业务日志
        • 使用CRD配置采集规则
    • 网络管理
      • CCE 集群内容器访问集群外服务
      • 容器网段空间耗尽如何继续扩容(VPC-ENI模式)
      • 容器网段空间耗尽如何继续扩容(VPC网络模式)
      • CCE IP Masquerade Agent 用户指南
      • 创建VPC-ENI模式集群
      • 对等连接场景下容器流量转发配置
      • 使用Network Policy网络策略
      • CCE 支持 IPv4 和 IPv6 双栈网络
      • 在CCE集群中使用NetworkPolicy
      • 网络编排
        • 集群 Pod 子网拓扑分布(容器网络 v2)
        • 容器网络 QoS 管理
        • VPC-ENI指定子网分配IP(容器网络 v2)
      • 网络连通性
        • 容器网络通过 NAT 网关访问公网
      • 网络维护
        • CCE容器网络常见错误码对应表
      • DNS
        • DNS 原理概述
        • DNS 问题排查指南
        • CoreDNS 组件手动升级指南
    • 虚拟节点
      • 管理虚拟节点
      • 配置BCIPod
      • 配置bci-profile
    • 备份中心
      • 备份概述
      • 恢复管理
      • 备份仓库
      • 备份管理
    • 巡检与诊断
      • GPU运行环境检查
      • 集群巡检
      • 故障诊断
    • 流量接入
      • NGINX Ingress 使用配置参考
      • CCE基于nginx-ingress实现灰度发布
      • BLB Ingress Annotation说明
      • 通过CCE使用K8S_Ingress
      • 通过YAML创建LoadBalancer_Service
      • 通过CCE使用K8S_Service
      • LoadBalancer Service Annotation说明
      • 使用直连 Pod 模式 LoadBalancer Service
      • Service复用已有负载均衡BLB
      • 通过YAML创建CCE_Ingress
      • 使用 NGINX Ingress
    • 权限管理
      • 配置集群OIDC认证
      • 配置IAM标签权限策略
      • 配置IAM自定义权限策略
      • 配置IAM预置权限策略
      • 权限概述
      • 配置预置RBAC权限策略
    • 配置管理
      • Secret管理
      • Configmap管理
    • 集群管理
      • 集群快照
      • CCE 安全组
      • 查看集群
      • 创建集群
      • 操作集群
      • 升级集群Kubernetes版本
      • 通过kubectl连接集群
      • 托管集群使用说明
      • CCE 支持 GPUSharing 集群
      • CCE节点资源预留说明
      • CCE 节点 CDS 扩容
  • 服务等级协议SLA
    • CCE服务等级协议SLA(V1.0)
  • Solution-Fabric
    • Fabric解决方案
  • API参考
    • 通用说明
    • 公共头和错误返回
    • 概述
  • 常见问题
    • windows下使用kubectl
    • 自动扩缩容常见问题
    • 通过kubectl创建简单的服务
    • 业务应用如何使用负载均衡?
    • 常见问题总览
    • 集群管理常见问题
  • API_V2参考
    • 通用说明
    • Instance相关接口
    • 附录
    • Autoscaler相关接口
    • 组件管理相关接口
    • 套餐适配相关接口
    • Task相关接口
    • 公共头和错误返回
    • Network相关接口
    • 服务域名
    • Cluster相关接口
    • Kubeconfig相关接口
    • InstanceGroup相关接口
    • RBAC相关接口
    • 概述
  • 产品定价
    • 产品定价
  • Solution-Xchain
    • 超级链解决方案
  • SDK
    • Go-SDK
      • 节点组管理
      • 节点管理
      • 集群管理
      • 初始化
      • 安装SDK工具包
      • 概述
  • 文档中心
  • arrow
  • 容器引擎CCE
  • arrow
  • 操作指南
  • arrow
  • 节点组管理
  • arrow
  • 节点组管理
本页目录
  • 概述
  • 创建节点组
  • 查看节点组
  • 配置自动伸缩
  • 步骤一:开通自动伸缩
  • 步骤二:全局配置
  • 步骤三:自动伸缩配置
  • 调整节点数
  • 编辑节点组高级配置
  • 复制节点组
  • 删除节点组
  • 移除节点

节点组管理

更新时间:2025-08-21

概述

本文介绍如何通过容器引擎 CCE 控制台在集群中创建节点组,以及节点组的查看、管理及删除等操作。如需了解相关概念和使用限制,请参见 节点组介绍。

创建节点组

  1. 登录百度智能云容器引擎 CCE 控制台,在左侧导航栏,点击 "集群管理->集群列表",进入集群列表页,点击集群名称,进入集群管理页面。
  2. 在左侧导航栏,点击 "节点组",进入节点组列表页。
  3. 点击 "创建节点组" 按钮或者 "马上创建" 链接,进入节点组创建页面。
  4. 填写节点组基本配置,配置项及说明如下:
  • 节点组信息
配置项 说明
节点组名称 自定义,支持大小写字母、数字、中文以及“-_ /.”;必须以字母开头,长度1-65。
VPC 网络 默认是集群的 VPC 网络,不支持更改。
Worker 安全组 支持配置“使用默认安全组”和“使用自定义安全组”。使用默认安全组会绑定集群当前关联的安全组,若现有的安全组不合适,可以自定义安全组。请在实例创建后,根据实际访问需求添加或修改访问规则 CCE默认/附加安全组说明。

  • 节点配置:后续扩容节点组将以此配置作为创建节点的模版。
配置项 说明
节点类型 按需选择,目前支持云服务器 BCC、弹性裸金属服务器 EBC、裸金属服务器 BBC。
付费方式 按需选择,目前支持后付费、预付费、抢占实例。
  • 包年包月:需要提前一次性支付所选时间段内的费用,这种模式价格相较于按量付费模式更加低廉。
  • 按量付费:按实例的实际使用量收费,不需要提前支付费用,但需要保证账户余额大于或等于100元,这种模式比预付费模式价格高一些。
  • 抢占实例:一种新运作模式,您在指定范围内出价,当指定实例规格的市场价格低于您的出价,且资源库存充足时,会成功创建抢占实例,并按照当前市场价计费。
  • 可用区 可用区是指在同一地域下,电力和网络互相独立的物理区域,故障会被隔离在一个可用区内。用于筛选可用区下可用的子网。
    节点子网 选择为节点分配 IP 地址的子网。不同可用区可用子网不同。
    实例配置 根据CPU与内存比值的不同,云服务器提供了多种不同类型的实例规格族。关于实例规格及适用的应用场景您可参考实例规格。
    镜像类型及操作系统 您可根据实际需求,选择适合的镜像类型及操作系统。
  • 公共镜像:由百度智能云官方提供,仅包含基础操作系统环境。
  • 自定义镜像: 通过创建自定义镜像功能生成的镜像,包含系统盘基础操作系统、应用及软件环境的个性化配置。自定义镜像可以帮助您快速创建包含个性化配置的云服务器。
  • 共享镜像: 支持用户将自定义镜像共享给其他用户,被共享用户可以通过管理控制台或API查询到其他用户共享的镜像。被共享用户可以使用其他用户共享的镜像创建实例和重装操作系统。
  • 系统盘 用于安装操作系统。非异构计算实例且镜像os是linux,默认大小20GB;若镜像os是windows,默认大小40GB;异构计算实例不区分操作系统默认均为40GB。根据地域以及实例规格的不同,可选择的云盘类型也不同,以页面实际提供的云盘类型为准。
    数据盘 即挂载的数据盘,用于提高云服务器的存储容量,默认不选择。云磁盘挂载数量有一定上限,若您想挂载超出上限的云磁盘,请提交工单联系我们。当前,云服务器的系统盘和数据盘均为CDS云磁盘,关于CDS的磁盘类型和使用限制请查看磁盘类型和使用限制。
    绑定快照策略 默认关闭绑定快照策略。通过快照,您可以实现磁盘数据备份,磁盘数据恢复以及磁盘镜像的制作。更多关于快照的使用方法和使用限制,请查看快照使用说明。快照目前是收费服务,请查看快照计费说明。
    公网IP 如需公网访问,请购买弹性公网IP,或在实例购买成功后绑定已有的弹性公网IP。公网带宽支持以下购买方式:
  • 包年包月计费:需要提前一次性支付所选时间段内的带宽费用,购买包年包月的云服务器时,费用将合并在实例中收取。
  • 按使用流量计费:根据用户实际传输的数据量计费,流量使用没有上限,但可限定最大峰值带宽。
  • 按使用带宽计费:根据用户选择的固定带宽值进行计费,最大可购买200Mbps的带宽。
  • 实例名称 您可自定义设置实例名称或由系统随机生成实例名称。
    Domain开关 用户打开后,主机名将带有domain后缀,支持DNS解析。
    管理用户名 Windows系统的管理员账号为Administrator,Linux系统的管理员账号为root。
    管理员密码 根据实例操作系统的不同,密码可供选择的设置方式也不同。
  • 用户自定义:自定义设置登录实例的密码。
  • 随机生成:购买成功后需登录控制台重置密码,可参考 重置密码。
  • 密钥对:Linux操作系统可以选择使用密钥对的方式连接云服务器,SSH密钥对是一种比常规密码更安全的登录云服务器的方式,具体可参考密钥对设置。
  • 数量 填写的节点数量即初始设置的期望节点数。数量限制如下:
  • 单个节点组容量上限为1000。
  • 每次操作最多200个节点。
  • 扩容上限受节点组中各子网剩余IP数量总和以及机型库存限制。
  • 部署集 指定部署集中创建云服务器实例时,会和处于同一部署集中的其他云服务器实例,按照物理服务器打散,保障发生硬件故障等异常情况下时的服务高可用性。具体可参考部署集进行设置。单个实例最多可加入2个部署集。
    自动伸缩 启用自动伸缩,系统将根据节点配置和自动伸缩配置,在符合扩容条件时,自动进行扩容操作。并自动计算节点费用、生成订单。扩容操作完成后,可自行查看节点和订单信息。
    故障检测和自愈 支持节点故障检测,可按需配置自愈规则。

    • 高级配置
    配置项 说明
    扩缩容策略
  • 机型配置顺序:节点组会根据您配置的主备机型顺序进行扩缩容。若主机型无法扩容,则选择备选机型尝试扩容。
  • 多子网均匀分布:在伸缩组指定的多可用区(即指定多个子网)之间尽最大努力均匀分配节点实例。只有配置了多个子网时该策略才能生效。
  • 节点显存共享 默认不勾选。勾选该选项后,新添加的节点默认开启 GPU 共享能力。显存共享仅对带有 GPU 设备的节点生效,未带有 GPU 设备的节点将会被忽略。 详情请参考 GPU独占和共享 。
  • 注意:开启节点显存共享前提是需要安装GPU Manager 和 AI Job Scheduler 组件。
  • kubelet数据目录 volume文件、plugin文件等数据存储目录,例如 /var/lib/kubelet。
  • 如果已挂载数据盘,建议存储到数据盘
  • 容器数据目录 容器、镜像等数据存储目录。勾选即可设置容器和镜像存储目录,例如 /home/cce/containerd。
  • 如果已挂载数据盘,建议存储到数据盘
  • 部署前执行脚本 节点部署前将自动执行该脚本,您需要自行保证脚本的可重入及重试逻辑。脚本内容和产生日志将写入节点的/usr/local/cce/scripts/目录下。
    部署后执行脚本 节点部署后将自动执行该脚本,您需要自行确定脚本的执行情况。脚本内容和产生日志将写入节点的/usr/local/cce/scripts/目录下。
    自定义 kubelet 参数 支持自定义配置 Kubelet参数,详情请参见 自定义 kubelet 参数介绍。
    封锁节点 默认关闭。选择开启封锁节点后,节点将处于不可调度状态,新创建的Pod将不会调度到该节点上。若需要取消封锁,请执行kubectl uncordon命令。封锁节点将减少该节点所属集群的剩余可用资源配额,若集群本身预留的可用资源不足,将会影响后续正常业务的调度和存量业务的运行。
    资源标签 资源标签支持您按各种标准(如用途、所有者或项目)对云上资源进行分类,每个标签包含键和值两部分,具体可参考标签功能进行设置。
  • 默认为实例关联资源 CDS、EIP 统一添加标签,可以选择关闭。
  • IAM 角色 为云服务器实例设置IAM角色。更多信息详见 设置IAM角色。
    标签(Labels) K8S标签(Label)是管理和选择K8S对象的标识, 将自动绑定到节点组创建的节点;每个Label包含键和值两部分。更多信息详见K8S标签说明。
    污点(Taints) 节点污点和Pod容忍共同作用。节点设置污点后,可避免Pod调度到节点上,或者将Pod从节点驱逐。除非Pod容忍能够节点污点相匹配。更多信息详见污点和容忍说明。
    注解(Annotations) Annotations(注解)是一种将非标识性元数据附加到对象上的机制,每个Annotation包含键和值两部分。。更多信息详见注解说明。

    image.png

    1. 点击“完成”按钮,完成节点组的创建。

    查看节点组

    1. 创建完成后,返回节点组列表,即可查看节点组。
    2. 节点组列表中展示可查看以下信息:
    列名 说明
    节点组名称/ID 节点组 ID 作为节点组的唯一标识,可用于在集群的节点列表中,搜索节点组中的具体节点。
    付费方式 默认为后付费。
    实例配置 创建节点组时所选节点配置中的实例规格、类型信息。
    实际节点数 实际 Ready 节点数,节点的具体状态和扩缩容进度可在节点列表中查看。
    期望节点数 创建节点组时设置的节点数量,即期望节点组中保持可用的节点数量。
    自动伸缩范围 若启用自动弹性伸缩可查看自动伸缩范围,将在该伸缩范围内自动调节期望节点数。
    故障检测自愈 若启用故障检测自愈,可查看故障自愈的规则。
    创建时间 节点组的创建时间。

    配置自动伸缩

    步骤一:开通自动伸缩

    初次使用节点组功能,首次配置自动伸缩,需要先授权开通自动伸缩,才可以启用自动伸缩功能。可在节点组列表的全局配置模块中点击授权开通自动伸缩开通,也可以在首次创建节点组时开通。

    image.png

    image.png


    步骤二:全局配置

    授权开通自动伸缩后,可在节点组列表的全局配置模块中点击编辑配置,在全局配置弹窗中开启自动缩容并配置扩容算法,该配置将应用于集群中所有启用自动伸缩功能的节点组。相关配置项及说明如下:

    配置项 可选项 说明
    自动缩容 缩容阀值 伸缩组内节点资源(cpu、gpu、mem)利用率均低于设定阈值时,集群可能会触发自动缩容。默认输入范围:20 - 80。
    缩容触发时延 在配置的缩容触发时延内,节点资源利用率持续低于缩容阈值,集群可能会触发自动缩容。默认输入范围:1 - 60。
    最大并发缩容数 当节点的利用率为0时,并发缩容节点的数目。默认输入值范围:1 - 20。
    扩容后缩容启动间隔 扩容出来的节点经过此间隔后开始评估是否可以被缩容。默认输入值范围:1 - 60。
    不缩容以下节点 包含本地存储 Pod 包含 kube-system 命名空间下非 DaemonSet 管理的 pod。
    扩容算法 随机 详情参见 扩容算法介绍。
    least-waste
    most-pods
    priority

    image.png


    步骤三:自动伸缩配置

    授权开通自动伸缩后,可在创建节点组时,或在节点组列表页的操作中,对节点组启用或停用自动伸缩功能,并配置相应的自动伸缩策略,以下介绍如何为已有节点组配置自动伸缩。

    1. 在节点组列表页中,找到目标节点组,点击操作列中的更多 > 自动伸缩配置。
    2. 在自动伸缩配置弹窗中启用自动伸缩,并配置伸缩范围和扩容优先级。
    配置项 说明
    伸缩范围 启用自动弹性伸缩后,将在该伸缩范围内自动调节期望节点数。您可输入期望的最小节点数和最大节点数。
    扩容优先级 自动扩容时,将以扩容优先级顺序,对已启用自动伸缩的节点组进行扩容。数值越大,优先级越高。

    image.png


    调整节点数

    调整节点数即通过手动调整节点组的期望节点数,来实现节点组扩容或缩容的目的。

    1. 在节点组列表页中,找到需要调整节点数的目标节点组,点击操作列中的调整节点数。
    2. 在调整节点组弹窗中输入期望节点数,点击确定即可调整节点组的期望节点数。

    说明:

    • 若已启用自动伸缩,在符合扩缩容条件时,不支持手动修改期望节点数,CCE 将在伸缩范围内为节点组自动调整期望节点数。
    • 若不希望自动调整期望节点数,请先在自动伸缩配置中关闭自动伸缩,再手动调整节点数。
    • 期望的节点数不是新增节点数量。例如:扩容前节点池中已存在 3 个节点。当您配置期望节点数为 5 时,系统会自动扩容 2 个节点,满足 5 个节点的期望,而不是新增 5 个节点。

    • 单个节点组容量上限为1000。
    • 每次操作最多500个节点。
    • 扩容上限受节点组中各子网剩余IP数量总和以及机型库存限制。

    image.png


    编辑节点组高级配置

    创建节点组后,CCE集群支持通过控制台调整部分节点组配置。

    说明:

  • 节点组编辑高级配置过程中,不会影响节点组内已有节点和业务的运行。
  • 节点组配置更新后,除特殊说明场景外(例如同步更新存量节点的标签(Labels)、污点(Taints)及注解(Annotations)),不会修改节点组已有节点的配置,仅作用于新增节点。
  • 节点组配置更新后,后续节点组中新增的节点都将默认使用该配置。
  • 更新节点组配置需参见本步骤来实现。如您通过其他方式对节点进行了更改,节点组升级时这些更改会被覆盖。
  • 勾选同步更新存量节点的标签(Labels)、污点(Taints)及注解(Annotations)功能,在节点组中新增或修改标签、污点、注解,会自动更新到新建节点和存量节点。同时,修改存量节点上的标签和污点后,节点上的配置会被节点组的配置刷新。
  • 关闭同步更新存量节点的标签(Labels)、污点(Taints)及注解(Annotations)功能,在节点组中新增或修改标签、污点、注解,仅会同步到新建节点,不会更新到存量节点。同时,修改存量节点上的标签和污点后,存量节点上的配置以修改后的配置为准,不会被节点组的配置刷新。
    1. 在节点组列表页中,找到需要移除节点的目标节点组,点击节点组名称/ID进入节点组详情页。
    2. 在节点组详情页高级配置点击修改,修改节点组高级配置页面,编辑节点组的配置项,并按照页面提示完成配置。 image.png
      image.png

    复制节点组

    通过 CCE 控制台可以轻松地复制现有节点组的配置,并基于这些配置创建新的节点组。

    1. 在节点组列表页中,找到需要复制的目标节点组,点击操作列中的更多 > 复制。

      image.png

    2. 在复制节点组页面中,可以看到复制的节点组配置,您可以根据需要进行修改。确定配置后单击完成即可进行节点组复制。

    删除节点组

    删除节点组,可根据实际需要选择是否保留/移出/释放节点,以及是否释放实例绑定的后付费公网 IP 和云磁盘。

    注意: 节点组删除后无法恢复,请做好数据备份,谨慎操作。

    1. 在节点组列表页中,找到需要删除的目标节点组,点击操作列中的删除。
    2. 在删除节点组弹窗中选择是否保留/移出/释放该节点组中的节点,并选择是否释放实例绑定的后付费公网 IP 和云磁盘。在删除节点组时您可选择进行如下操作:

      • 将该节点组中的节点继续保留在集群中
      • 将该节点组中的节点移出集群,但保留虚机资源
      • 将该节点组中的节点移出集群,并释放虚机资源(预付费不会主动释放)
      • 释放实例绑定的后付费公网 IP 和云磁盘

    image.png


    移除节点

    注意:

    • 在使用节点组功能前已存在于集群中的节点,以及通过集群扩容、添加节点(非节点组方式)新建的节点,不归属于节点组,在节点管理 > 节点列表中单独管理。
    • 在集群的节点组管理 > 节点列表中移出节点,即以节点为操作对象,将完全按照当前节点的操作逻辑,不会影响节点组的期望节点数,节点组将根据当前期望节点数自动进行节点数量的调整。
    • 在节点管理 > 节点组 > 节点列表中移除节点会减少节点组对应的期望节点数量。
    1. 在节点组列表页中,找到需要移除节点的目标节点组,点击节点组名称/ID进入节点组详情页。
    2. 在左侧导航栏选择节点列表,查看当前节点组中的全部节点。
    3. 找到需要移出节点组的节点,在操作列选择移出节点。若您需要同时移出多个节点,可在当前页面中勾选多个节点后,点击上侧更多操作 > 移出节点对多个节点进行移出操作。
    4. 在移出节点弹窗中选择是否需要将该节点保留/移出集群,以及是否需要保留/释放节点对应的实例。

      • 将该节点组中的节点继续保留在集群中
      • 将该节点组中的节点移出集群,但保留虚机资源
      • 将该节点组中的节点移出集群,并释放虚机资源(预付费不会主动释放)
      • 释放实例绑定的后付费公网 IP 和云磁盘
    5. 点击确定,即可将节点移出节点组。

    image.png

    image.png

    上一篇
    工作负载
    下一篇
    节点组介绍