使用RAPIDS加速数据科学任务

GPU云服务器 GPU

  • 线上GPU驱动选装发布记录
  • 快速入门
  • 产品定价
  • 功能发布记录
  • 产品描述
    • 产品优势
    • 产品介绍
    • 应用场景
    • GPU卡详情
    • 实例规格
      • GPU渲染型
      • 弹性高性能计算集群
      • GPU计算型
      • GPU实例命名规则
  • AI加速套件AIAK
    • AIAK推理加速组件
  • 典型实践
    • 基于Nvidia Clara Parabricks的基因测序加速
    • 基于GPU云服务器部署NIM
    • NCCL环境搭建
    • 使用TensorRT加速深度学习推理
    • 使用Nsight工具分析优化应用程序
    • 使用RAPIDS加速数据科学任务
    • 部署满血版DeepSeek-R1模型SGlangServer(单机&多机部署&参数建议)
    • 搭建PaddlePaddle环境完成文本情感分类
    • 基于GPU实例部署NGC环境
  • 操作指南
    • 镜像使用
    • 查看GPU云服务器监控
    • 申请GPU物理服务器
    • 创建GPU实例
    • 数据上传
    • 管理GPU实例
    • 安装GPU驱动
      • 为GPU实例安装GRID驱动(Windows)
      • 手动安装GPU驱动以及Cuda(Windows)
      • 手动安装GPU驱动以及Cuda(Linux)
      • 自动安装GPU驱动及CUDA(推荐)
  • 常见问题
    • 如何检测RDMA常见故障
    • 一般类问题
    • 如何检测GPU常见故障
所有文档
menu
没有找到结果,请重新输入

GPU云服务器 GPU

  • 线上GPU驱动选装发布记录
  • 快速入门
  • 产品定价
  • 功能发布记录
  • 产品描述
    • 产品优势
    • 产品介绍
    • 应用场景
    • GPU卡详情
    • 实例规格
      • GPU渲染型
      • 弹性高性能计算集群
      • GPU计算型
      • GPU实例命名规则
  • AI加速套件AIAK
    • AIAK推理加速组件
  • 典型实践
    • 基于Nvidia Clara Parabricks的基因测序加速
    • 基于GPU云服务器部署NIM
    • NCCL环境搭建
    • 使用TensorRT加速深度学习推理
    • 使用Nsight工具分析优化应用程序
    • 使用RAPIDS加速数据科学任务
    • 部署满血版DeepSeek-R1模型SGlangServer(单机&多机部署&参数建议)
    • 搭建PaddlePaddle环境完成文本情感分类
    • 基于GPU实例部署NGC环境
  • 操作指南
    • 镜像使用
    • 查看GPU云服务器监控
    • 申请GPU物理服务器
    • 创建GPU实例
    • 数据上传
    • 管理GPU实例
    • 安装GPU驱动
      • 为GPU实例安装GRID驱动(Windows)
      • 手动安装GPU驱动以及Cuda(Windows)
      • 手动安装GPU驱动以及Cuda(Linux)
      • 自动安装GPU驱动及CUDA(推荐)
  • 常见问题
    • 如何检测RDMA常见故障
    • 一般类问题
    • 如何检测GPU常见故障
  • 文档中心
  • arrow
  • GPU云服务器GPU
  • arrow
  • 典型实践
  • arrow
  • 使用RAPIDS加速数据科学任务
本页目录
  • 背景介绍
  • 应用特点
  • 获取RAPIDS

使用RAPIDS加速数据科学任务

更新时间:2025-08-21

背景介绍

本文介绍如何在GPU云服务环境中下载、安装并使用RAPIDS软件库。

RAPIDS是一套开源的软件库,旨在提供给用户一整套能够完全在GPU上执行的端到端的数据科学及其分析的API调用。它面向解析和数据科学中的常规数据处理任务,囊括了多种端到端的机器学习算法。且不用耗费更多的开销就可以轻松实现加速。对多节点,多GPU的部署使其可以轻松的实现在更大尺度的数据集上完成训练和加速任务。

RAPIDS的详细介绍可参考链接

应用特点

数据预处理/ETL(Extract-Transform-Load)

  • CuDF: 类似pandas的dataframe的操作库,包含GPU加速的ETL函数,可集成Dask与可扩展UCX

机器学习与图计算

  • CuML:GPU原生的机器学习库,包含XGBoost,FIL,HPO等常见机器学习库
  • cuGraph:GPU图解析,包括TSP,PageRank等常见图计算相关的库

可视化

  • cuxfilter:GPU加速的交叉过滤
  • pyViz集成:Plotly Dash,Bokenh,Datashader,HoloViews,hvPlot等

应用相关计算

与具体业务场景或特定领域强相关的一些软件库,包括:

  • cuSignal:信号处理
  • cuSpatial:空间解析
  • CLX+Morpheus:网络日志处理+异常检测
  • cuStreamz:流式化解析
  • cuCIM:计算机视觉和图像处理的源语
  • node-RAPIDS:用于node.js的绑定

获取RAPIDS

推荐您使用RAPIDS的container,可以通过注册NGC之后进行拉取,NGC的操作方法详见 基于GPU实例部署NGC环境 。 获取NGC环境之后,在页面中搜索RAPIDS即可获取链接

image.png

上一篇
使用Nsight工具分析优化应用程序
下一篇
部署满血版DeepSeek-R1模型SGlangServer(单机&多机部署&参数建议)