基于GPU实例部署NGC环境

GPU云服务器 GPU

  • 线上GPU驱动选装发布记录
  • 快速入门
  • 产品定价
  • 功能发布记录
  • 产品描述
    • 产品优势
    • 产品介绍
    • 应用场景
    • GPU卡详情
    • 实例规格
      • GPU渲染型
      • 弹性高性能计算集群
      • GPU计算型
      • GPU实例命名规则
  • AI加速套件AIAK
    • AIAK推理加速组件
  • 典型实践
    • 基于Nvidia Clara Parabricks的基因测序加速
    • 基于GPU云服务器部署NIM
    • NCCL环境搭建
    • 使用TensorRT加速深度学习推理
    • 使用Nsight工具分析优化应用程序
    • 使用RAPIDS加速数据科学任务
    • 部署满血版DeepSeek-R1模型SGlangServer(单机&多机部署&参数建议)
    • 搭建PaddlePaddle环境完成文本情感分类
    • 基于GPU实例部署NGC环境
  • 操作指南
    • 镜像使用
    • 查看GPU云服务器监控
    • 申请GPU物理服务器
    • 创建GPU实例
    • 数据上传
    • 管理GPU实例
    • 安装GPU驱动
      • 为GPU实例安装GRID驱动(Windows)
      • 手动安装GPU驱动以及Cuda(Windows)
      • 手动安装GPU驱动以及Cuda(Linux)
      • 自动安装GPU驱动及CUDA(推荐)
  • 常见问题
    • 如何检测RDMA常见故障
    • 一般类问题
    • 如何检测GPU常见故障
所有文档
menu
没有找到结果,请重新输入

GPU云服务器 GPU

  • 线上GPU驱动选装发布记录
  • 快速入门
  • 产品定价
  • 功能发布记录
  • 产品描述
    • 产品优势
    • 产品介绍
    • 应用场景
    • GPU卡详情
    • 实例规格
      • GPU渲染型
      • 弹性高性能计算集群
      • GPU计算型
      • GPU实例命名规则
  • AI加速套件AIAK
    • AIAK推理加速组件
  • 典型实践
    • 基于Nvidia Clara Parabricks的基因测序加速
    • 基于GPU云服务器部署NIM
    • NCCL环境搭建
    • 使用TensorRT加速深度学习推理
    • 使用Nsight工具分析优化应用程序
    • 使用RAPIDS加速数据科学任务
    • 部署满血版DeepSeek-R1模型SGlangServer(单机&多机部署&参数建议)
    • 搭建PaddlePaddle环境完成文本情感分类
    • 基于GPU实例部署NGC环境
  • 操作指南
    • 镜像使用
    • 查看GPU云服务器监控
    • 申请GPU物理服务器
    • 创建GPU实例
    • 数据上传
    • 管理GPU实例
    • 安装GPU驱动
      • 为GPU实例安装GRID驱动(Windows)
      • 手动安装GPU驱动以及Cuda(Windows)
      • 手动安装GPU驱动以及Cuda(Linux)
      • 自动安装GPU驱动及CUDA(推荐)
  • 常见问题
    • 如何检测RDMA常见故障
    • 一般类问题
    • 如何检测GPU常见故障
  • 文档中心
  • arrow
  • GPU云服务器GPU
  • arrow
  • 典型实践
  • arrow
  • 基于GPU实例部署NGC环境
本页目录
  • 背景介绍
  • 前提条件
  • 操作方法

基于GPU实例部署NGC环境

更新时间:2025-08-21

背景介绍

NGC,Nvidia GPU Cloud是由NVIDIA和第三方ISV提供的GPU优化过的软件仓库,主要用于AI,HPC及虚拟化等领域。其中提供了众多容器(containers)、预训练的模型(pre-trained models)、用于Kubernetes部署的Helm charts、以及带有软件开发工具包(SDK)的行业特定AI工具包等。使用NGC可以为开发人员简化建立、定制化和GPU优化的软件的集成等过程,加速整个开发的实现过程。

前提条件

用户需要注册NGC的账号:https://ngc.nvidia.com/signin

操作方法

  1. 创建一台GPU实例,操作方法请参考创建GPU实例。

    注:选择实例镜像时候,需要选择NGC-Ready的系统镜像,目前NGC支持的系统镜像包括: Ubuntu 16.04, 18.04, and 20.04 RHEL 7.5 and 7.6

百度智能云目前已经提供了支持NGC-Ready的系统镜像,如需查看百度云支持的公共系统镜像请详见这里

  1. 对GPU实例安装GPU驱动,建议安装针对具体操作系统的最新版本的驱动,安装工驱动的方法,可以参考公共镜像使用步骤中提到的方式。
  2. 安装Docker 和 针对NVIDIA GPU的Docker Utility Engine,即nvidia-docker

Docker的安装方法可以参考这里: Ubuntu, CentOS.

这里我们以Ubuntu为例,具体信息请参考链接。

安装的操作顺序包括:

  1. 安装Docker的预备条件。
  2. 添加Docker官方的GPG key。
  3. 添加官方稳定的Docker仓库。

    Plain Text
    1$sudo apt-get install -y ca-certificates curl software-properties-common
    2$curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-ey add –
    3$sudo add-apt-repository “deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable”

    安装nvidia-docker:

    Plain Text
    1curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add –
    2distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
    3curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/apt/sources.list.d/nvidia-docker.list
    4sudo apt-get update
    5sudo apt-get install -y nvidia-docker2
    6sudo usermod -aG docker $USER
    7sudo systemctl daemon-reload
    8sudo systemctl reload docker
  4. NGC的API key生成

成功注册完NGC账号之后,需要生成账户的API key,生成的过程需要登录NGC页面,点击账户名,选择Setup,会进入Setup页面,然后点击Get API Key,进入生成API Key的页面。

image.png

进入页面之后,点击Generate API Key

image.png

系统会让你确认是否生成API Key,点击Confirm确认之后,页面会变为类似于如下图所示: image.png 在Password处会显示一连串密码,用户返回GPU实例的shell界面按照图中的操作即可

Plain Text
1$ docker login nvcr.io
2Username: $oauthtoken
3Password:[输入您生成的密码]
  1. 使用NGC中的镜像

    这里,我们以Triton为例:

• 进入NGC的CATALOG的目录部分,选择CONTAINERS分支,在Query查询中输入框架名称Triton

image.png

• 点击下面的Triton Inference Server的页面框,关于框架的介绍及拉取镜像的方法则会展示出来

image.png

• 我们按照上图中红色方框展示的命令,可以获得最新版本的容器镜像,继续在GPU实例的命令行中输入命令,即可

Plain Text
1    $ docker pull nvcr.io/nvidia/tritonserver:21.02-py3

这样,我们就可以以docker 容器的方式去使用框架或软件产品了。

上一篇
搭建PaddlePaddle环境完成文本情感分类
下一篇
操作指南