线上带ofed驱动的实例更换内核方案

云服务器 BCC

  • 功能发布记录
  • 产品描述
    • 实例规格
    • 什么是云服务器BCC
    • 已停售实例规格
    • 原机型与新机型名称对应关系
    • 使用限制
    • 产品优势
    • 应用场景
    • 型号及所在区域
  • Python-SDK
    • 实例
    • 地域
    • BccClient
    • 镜像
    • 版本变更记录
    • 快照
    • 预留实例券
    • 初始化
    • 安装SDK工具包
    • 磁盘
    • 安全组
    • 概述
  • Resources
    • 百度智能云镜像服务协议
    • 镜像快速指南
  • Transfer
    • 站点离线迁移方案
    • 站点平滑迁移方案
  • Java-SDK
    • 异常处理
    • 地域
    • BccClient
    • 镜像
    • 日志
    • 可用区
    • 部署集
    • 版本变更记录
    • 自动快照策略
    • 快照
    • 密钥对
    • 快速入门
    • 预留实例券
    • 安装SDK工具包
    • 磁盘
    • BCC实例
    • 安全组
    • 概述
  • 标签服务API参考
    • 通用说明
    • 附录1
    • 简介
    • 域名
    • 接口列表
      • 创建标签
      • 查看标签下绑定的资源
      • 删除标签
      • tag列表
  • 快速入门
    • 快速配置Windows云服务器
    • 云服务器安全说明
    • 快速配置Linux云服务器
  • 典型实践
    • Linux系统搭建FTP服务
    • 关闭windows防火墙教程
    • windowsServer2008关闭IE增强机制教程
    • 使用xshell连接windows服务器
    • 标签管理实践
    • 环境搭建
      • Windows系统搭建宝塔
      • Linux系统搭建FTP服务
      • 手动部署SQLServer2008R2Express版
      • Linux系统搭建宝塔
      • windows搭建IIS和FTP教程
      • Windows幻兽帕鲁服务器一键搭建
      • AccessVPN搭建典型实践
      • CentOS 7 yum安装MySQL 8.0
      • Linux幻兽帕鲁服务器一键搭建
    • 建站教程
      • 云服务器部署SSL证书-tomcat
      • Windows2008与Windows2012下使用IIS服务搭建网站
      • windows安装配置Nginx环境
      • 云服务器部署SSL证书-Apache
      • 云服务器部署SSL证书-IIS
      • Centos-7.2部署LNMP环境
      • 云服务器部署SSL证书-Nginx
      • windows安装配置Apache环境
      • Centos-7.2部署LAMP环境
  • 故障处理
    • Linux云服务器执行 yum update 报错存在依赖冲突
    • 无法远程连接Windows实例
    • GPU实例宕机故障排查
    • Linux云服务器进入单用户重置密码报错:Authentication token manipulation error
    • Linux云服务器进入单用户重置密码报错:Authentication token lock busy
    • Windows服务器ping不通
    • Linux云服务器进入单用户重置root密码
    • Linux云服务器设置登录方式
    • 无法远程连接Linux实例
  • 操作指南
    • 资源调研
    • 启动模板
    • 网络
      • Windows云服务器配置双网卡外网访问
      • 变更子网
      • 变更内网IP
      • 变更VPC
      • 配置ipv6地址
      • 绑定和解绑弹性公网IP
      • 弹性网卡
        • 挂载弹性网卡
        • 弹性网卡概述
        • 创建弹性网卡
        • 配置弹性网卡
      • 弹性RDMA网卡
        • 使用说明
        • 弹性RDMA网卡概述
    • 部署集
      • 在部署集内创建BCC实例
      • 创建部署集
      • 部署集内移出BCC实例
      • 为已有实例调整部署集
      • 修改部署集信息
      • 删除部署集
      • 部署集概述
    • 快照
      • 创建磁盘快照
      • 删除快照
      • 快照概述
      • 回滚快照
      • 自动快照
    • 镜像
      • windows镜像制作
      • 镜像概述
      • 百度智能云镜像服务协议
      • 删除自定义镜像
      • 数据与个人信息保护声明
      • 基于本地系统创建linux镜像
      • 重装操作系统
      • 共享自定义镜像
      • 镜像快速指南
      • 跨地域复制镜像
      • 镜像列表
      • 操作系统官方停止维护计划
      • 如何设置网卡多队列属性
      • 创建自定义镜像
      • 公共镜像发布记录
        • 2024 EBC公共镜像发布记录
        • 2023 EBC公共镜像发布记录
        • 2025 BCC公共镜像发布记录
        • 2023 BCC公共镜像发布记录
        • 2024 BCC公共镜像发布记录
      • 导入自定义镜像
        • 镜像格式转换
        • 使用导入的自定义镜像创建实例
        • 系统优化操作(Linux)
        • 导入概述
        • 镜像导入限制
        • 检测网络配置
        • 使用镜像检测工具检测镜像
        • 安装virtio驱动
        • 安装cloudbase-init
        • 镜像格式检查
        • 检查virtio驱动
    • 存储
      • 系统盘扩容
      • 概述
    • 服务器迁移
      • 迁移操作步骤
      • 服务器迁移操作流程
      • 服务器迁移概述
    • 运维与监控
      • 监控与报警
      • 使用救援模式
      • 疏散故障实例
      • 实例健康检查
      • 维修平台
        • 维修记录查询
        • 预授权规则设置
        • 维修平台概述
        • 维修平台接入说明
        • 维修任务
      • 自助诊断工具
        • 自助诊断工具概述
        • 应用性能诊断工具Btune
      • 云助手
        • 多用户访问控制
        • 创建命令
        • 我的命令
        • 上传文件
        • 常见问题
        • 实例列表
        • 云助手使用须知
        • 历史记录
        • 云助手概述
        • 公共命令
    • 弹性高性能计算集群
      • 弹性高性能计算集群概述
      • 创建弹性高性能计算集群
    • 标签管理
      • 标签管理概述
      • 基于标签查看资源账单
      • 配置标签
    • 实例
      • 重启实例
      • 实例续费
      • 修改实例名称
      • 实例概述
      • 重置密码
      • 启动实例
      • 功能限制
      • 后付费实例关机不计费
      • 设置IAM角色
      • 释放实例
      • 变更可用区
      • 批量连续命名
      • 查看实例
      • 变更实例配置
      • 回收实例
      • 跨AZ迁移
      • 停止实例
        • 停止实例
        • 弹性裸金属实例与弹性高性能计算集群实例halt能力配置说明
      • 登录实例
        • 登录方式概述
        • 登录Windows实例
          • 使用VNC远程登录云服务器
          • 使用远程桌面登录Windows实例
        • 登录Linux实例
          • SecrueCRT使用SSH密钥登录Linux实例
          • putty使用SSH密钥登录Linux实例
          • 使用VNC远程登录云服务器
          • 使用用户名密码验证连接Linux实例
          • 使用SmartTerm连接云服务器
          • Linux或Mac使用SSH密钥登录Linux实例
          • xshell使用SSH密钥登录Linux实例
      • 变更计费方式
        • 包年包月转按量付费
        • 按量付费转包年包月
      • 创建实例
        • 使用启动模板创建实例
        • 购买相同配置实例
        • 通过自定义镜像创建实例
        • 创建实例导航
        • 通过购买页创建实例
      • 抢占实例
        • 创建抢占实例
        • 什么是抢占实例
    • 预留实例券
      • 预留实例券介绍
      • 预留实例券跨帐号转移
      • 预留实例券变更AZ
      • FAQ
      • 预留实例券变更EHC集群
      • 续费预留实例券
      • 预留实例券购买
    • 安全
      • 多用户访问控制
        • 多用户访问控制
        • 价格权限管控
      • 密钥对
        • 解绑SSH密钥对
        • SSH密钥对概述
        • 删除SSH密钥对
        • 创建SSH密钥对
        • 绑定SSH密钥对
      • 安全组
        • 创建安全组
        • 编辑安全组
        • 取消关联安全组
        • 删除安全组
        • 关联安全组
        • 安全组概述
        • 复制安全组
  • 云助手API参考
    • 通用说明
    • 批量获取实例bsm-agent状态
    • 日志接口
    • 命令接口
    • 服务域名
    • 错误返回
    • 历史记录
    • 公共请求与响应头
  • 服务等级协议SLA
    • BCC服务等级协议SLA(V3.0)
    • 百度智能云云服务器可信云
  • Go-SDK
    • 实例
    • 地域
    • 镜像
    • 可用区
    • 磁盘专属集群
    • 部署集
    • 自动快照策略
    • 快照
    • 弹性高性能计算集群
    • 密钥对
    • 预留实例券
    • 初始化
    • 磁盘
    • 安全组
    • 概述
  • API参考
    • 通用说明
    • 附录
    • 服务域名
    • 公共请求头与响应头
    • 错误返回
    • 概述
    • 镜像相关接口
      • 根据实例ID批量查询OS信息
      • 跨地域复制自定义镜像
      • 镜像解绑标签
      • 删除自定义镜像
      • 共享自定义镜像
      • 取消跨地域复制自定义镜像
      • 查询镜像列表
      • 镜像绑定标签
      • 根据实例规格查询可用公共镜像
      • 取消共享自定义镜像
      • 修改自定义镜像名称
      • 查询镜像详情
      • 导入镜像
      • 创建自定义镜像
      • 查询镜像已共享的用户列表
    • 集群管理相关接口
      • EHC集群修改
      • EHC集群删除
      • EHC集群创建
      • EHC集群列表
    • 安全组相关接口
      • 创建安全组
      • 删除安全组规则
      • 实例关联安全组
      • 删除安全组
      • 实例解绑安全组
      • 查询安全组列表
      • 更新安全组规则
      • 撤销安全组规则
      • 授权安全组规则
      • 实例替换安全组
    • 预留实例券相关接口
      • 预留实例券绑定标签
      • 调整预留实例券
      • 预留实例券转入列表
      • 发起预留实例券转移
      • 预留实例券关闭自动续费规则
      • 查询预留实例券
      • 创建预留实例券
      • 撤销预留实例券转移
      • 预留实例券解绑标签
      • 拒绝预留实例券转移
      • 接受预留实例券转移
      • 预留实例券创建自动续费规则
      • 续费预留实例券
      • 预留实例券转出列表
    • 自动快照策略相关接口
      • 绑定自动快照策略
      • 自动快照策略变更
      • 创建自动快照策略
      • 删除自动快照策略
      • 查询自动快照策略详情
      • 解绑自动快照策略
      • 查询自动快照策略列表
    • 地域及可用区相关接口
      • 获取域名列表接口
      • 查询可用区列表
    • 密钥对相关接口
      • 删除密钥对
      • 导入密钥对
      • 查询密钥对详情
      • 创建密钥对
      • 查询密钥对列表
      • 重命名密钥对
      • 更改密钥对描述
      • 绑定密钥对
      • 解绑密钥对
    • 磁盘相关接口
      • 卸载CDS磁盘
      • 磁盘扩容及类型变更
      • 创建CDS磁盘
      • 磁盘绑定标签
      • 磁盘续费
      • 磁盘重命名
      • 释放CDS磁盘(新)
      • 开通自动续费
      • 磁盘计费变更
      • 修改磁盘属性
      • 获取可购买磁盘信息
      • 磁盘解绑标签
      • 挂载CDS磁盘
      • 查询CDS价格
      • 查询磁盘详情
      • 释放CDS磁盘
      • 取消自动续费
      • 查询磁盘列表
      • 回滚磁盘
    • 抢占实例相关接口
      • 取消抢占实例订单
      • 创建抢占实例
      • 查询抢占实例市场价
      • 查询抢占实例套餐
    • 维修平台相关接口
      • 维修任务相关接口
      • 维修记录相关接口
      • 预授权相关接口
    • 快照相关接口
      • 跨地域复制快照
      • 查询快照链列表
      • 快照链绑定标签
      • 创建快照
      • 查询快照列表
      • 删除快照
      • 查询快照详情
      • 快照链解绑标签
    • 专属集群相关接口
      • 专属集群续费
      • 专属集群解绑标签
      • 开通专属集群自动续费
      • 查询专属集群列表
      • 专属集群绑定标签
      • 取消专属集群自动续费
      • 查询专属集群详情
      • 变配专属集群
      • 创建专属集群
    • 其他接口
      • 查询实例套餐价格
      • 查询实例套餐规格(新)
      • 通过套餐规格查询可用区
    • 实例相关接口
      • 重启实例
      • 启动实例(批量启动)
      • 修改实例描述
      • 回收站内BCC恢复计费
      • 实例续费
      • 计费变更-转包年包月
      • 批量退订预付费实例
      • 重装实例
      • 批量删除主网卡辅助IP
      • 修改实例密码
      • 查询实例自定义数据
      • 启动实例
      • 创建实例(通过指定实例套餐规格)
      • 获取实例角色列表
      • 查询可变配规格
      • 查询可关机不计费的实例列表
      • 进入救援模式
      • 重装实例(批量重装)
      • 预付费实例提前释放
      • 删除实例与部署集之间的关系
      • 实例变更子网
      • 批量转按量付费
      • 释放后付费实例(POST请求的释放)
      • 停止实例(批量停止)
      • 实例解绑标签
      • 根据实例id查询实例列表
      • 绑定角色
      • 停止实例
      • 修改实例主机名
      • 批量变配实例
      • 批量增加主网卡辅助IP
      • 后付费设置自动释放
      • 将实例移出安全组
      • 查询回收站实例列表
      • 查询实例VNC地址
      • 退出救援模式
      • 查询实例列表
      • 实例变配(通过指定实例套餐规格)
      • 创建实例
      • 将实例加入安全组
      • 解绑角色
      • 实例绑定标签
      • 释放ipv6
      • 释放回收站实例
      • 查询指定实例详情
      • 删除自动续费规则
      • 添加ipv6
      • 设置实例删除保护
      • 修改实例属性
      • 实例变更VPC
      • 设置抢占实例eip自动释放
      • 批量释放实例
      • 批量转包年包月
      • 查询多个实例详情
      • 获取实例网卡信息
      • 创建自动续费规则
    • 部署集相关接口
      • 修改部署集
      • 获取部署集详情
      • 创建部署集
      • 调整部署集
      • 查询部署集列表
      • 部署集移出实例
      • 删除部署集
  • 常见问题
    • 计费类
    • 虚拟机运维类
    • 存储类
    • 镜像类
    • 安全类
    • 实例类
    • 网络类
    • 常见问题总览
    • 快照类
    • 预留实例券
    • 性能类
  • Python3-SDK
    • 实例
    • 地域
    • BccClient
    • 镜像
    • 磁盘专属集群
    • 部署集
    • 自动快照策略
    • 快照
    • 密钥对
    • 预留实例券
    • 初始化
    • 安装SDK工具包
    • 磁盘
    • 安全组
    • 概述
  • 视频专区
    • 操作指南
    • 故障处理
    • 产品简介
    • 操作指南
      • 密码功能
      • 基础功能
      • 网络相关
      • 环境搭建
      • 运维参考
  • 产品定价
    • 计费概述
    • 退款说明
    • 计费方式
      • 按量付费(后付费)定价
      • 包年包月(预付费)定价
      • 产品定价
  • 运维参考
    • 服务器配置
      • Windows pip配置百度源
      • linux pip配置百度源
      • 线上带ofed驱动的实例更换内核方案
      • Debian 9软件源配置更新
    • Windows运维参考
      • WindowsBCC实例入域后实现SID唯一
      • Windows快速登录
      • Windows修改默认连接远程端口
      • 系统黑屏处理方法
      • Windows CPU内存跑满排查步骤
      • 性能资源
      • 关闭windows防火墙教程
      • 蓝屏宕机常规处理方法
      • Windows实例磁盘空间不足清理教程
      • 服务器重启后无法显示数据盘
      • 系统激活
      • 本地播放Windows服务器中的声音
      • WindowsBCC实例卡顿问题
      • 使用xshell连接windows服务器
      • Windows允许单个用户连接多个会话的方法
      • 配置多用户访问Windows服务器
      • Windows释放为硬件保留内存
      • Windows虚机自动登录失败处理办法
      • windowsServer关闭IE增强机制教程
      • Windows自动更新相关配置
      • windows设置只允许本地&固定IP访问远程端口
      • 桌面及应用颜色变黑处理方法
      • 远程连接Windows后无法使用剪切板
    • Linux运维参考
      • Linux修改默认远程连接端口
      • Ubunut16.04订阅扩展安全维护(ESM)
      • LinuxBCC实例卡顿问题
      • Linux服务器CPU内存跑满问题排查
      • 配置Linux 分析工具atop和kdump
      • Centos7安装docker
      • Linux格式化与挂载实例挂载本地磁盘
      • LinuxBCC实例提示空间不足问题解决
      • 无法通过SSH方式登录LinuxBCC实例怎么办
      • Linux镜像如何开启或关闭intelCPU漏洞补丁
      • 云服务器删除或者修改文件时提示文件系统只读
      • fstab配置导致系统启动异常如何处理
      • 进入单用户模式
        • Ubuntu进入单用户
        • CentOS7进入单用户
        • CentOS6进入单用户
        • opensuse42.3进入单用户
        • Centos8进入单用户
        • freebsd11单用户修改密码SOP
      • 性能测试
        • Linux-CPU性能测试
        • Linux-磁盘IO性能测试
        • Linux-网络性能测试
      • Linux系统安装图形化界面并远程连接
        • CentOS
          • CentOS7.2安装gnome图形化界面并使用VNCViewer连接
          • CentOS6.5安装KDE桌面图形化界面并使用VNCViewer连接
          • CentOS8安装图形化界面并使用VNCViewer连接
        • opensuse
          • opensuse42.3安装图形化界面并使用VNCViewer连接
        • Ubuntu
          • Ubuntu18.04安装图形化界面并使用VNCViewer连接
          • Ubuntu14.04安装图形化界面并使用VNCViewer连接
  • 云助手API和SDK参考
    • Python SDK
      • CaClient
      • 安装SDK
      • 批量获取实例内bsm-agent状态
      • 日志接口
      • 命令接口
      • 初始化
      • 历史记录
所有文档
menu
没有找到结果,请重新输入

云服务器 BCC

  • 功能发布记录
  • 产品描述
    • 实例规格
    • 什么是云服务器BCC
    • 已停售实例规格
    • 原机型与新机型名称对应关系
    • 使用限制
    • 产品优势
    • 应用场景
    • 型号及所在区域
  • Python-SDK
    • 实例
    • 地域
    • BccClient
    • 镜像
    • 版本变更记录
    • 快照
    • 预留实例券
    • 初始化
    • 安装SDK工具包
    • 磁盘
    • 安全组
    • 概述
  • Resources
    • 百度智能云镜像服务协议
    • 镜像快速指南
  • Transfer
    • 站点离线迁移方案
    • 站点平滑迁移方案
  • Java-SDK
    • 异常处理
    • 地域
    • BccClient
    • 镜像
    • 日志
    • 可用区
    • 部署集
    • 版本变更记录
    • 自动快照策略
    • 快照
    • 密钥对
    • 快速入门
    • 预留实例券
    • 安装SDK工具包
    • 磁盘
    • BCC实例
    • 安全组
    • 概述
  • 标签服务API参考
    • 通用说明
    • 附录1
    • 简介
    • 域名
    • 接口列表
      • 创建标签
      • 查看标签下绑定的资源
      • 删除标签
      • tag列表
  • 快速入门
    • 快速配置Windows云服务器
    • 云服务器安全说明
    • 快速配置Linux云服务器
  • 典型实践
    • Linux系统搭建FTP服务
    • 关闭windows防火墙教程
    • windowsServer2008关闭IE增强机制教程
    • 使用xshell连接windows服务器
    • 标签管理实践
    • 环境搭建
      • Windows系统搭建宝塔
      • Linux系统搭建FTP服务
      • 手动部署SQLServer2008R2Express版
      • Linux系统搭建宝塔
      • windows搭建IIS和FTP教程
      • Windows幻兽帕鲁服务器一键搭建
      • AccessVPN搭建典型实践
      • CentOS 7 yum安装MySQL 8.0
      • Linux幻兽帕鲁服务器一键搭建
    • 建站教程
      • 云服务器部署SSL证书-tomcat
      • Windows2008与Windows2012下使用IIS服务搭建网站
      • windows安装配置Nginx环境
      • 云服务器部署SSL证书-Apache
      • 云服务器部署SSL证书-IIS
      • Centos-7.2部署LNMP环境
      • 云服务器部署SSL证书-Nginx
      • windows安装配置Apache环境
      • Centos-7.2部署LAMP环境
  • 故障处理
    • Linux云服务器执行 yum update 报错存在依赖冲突
    • 无法远程连接Windows实例
    • GPU实例宕机故障排查
    • Linux云服务器进入单用户重置密码报错:Authentication token manipulation error
    • Linux云服务器进入单用户重置密码报错:Authentication token lock busy
    • Windows服务器ping不通
    • Linux云服务器进入单用户重置root密码
    • Linux云服务器设置登录方式
    • 无法远程连接Linux实例
  • 操作指南
    • 资源调研
    • 启动模板
    • 网络
      • Windows云服务器配置双网卡外网访问
      • 变更子网
      • 变更内网IP
      • 变更VPC
      • 配置ipv6地址
      • 绑定和解绑弹性公网IP
      • 弹性网卡
        • 挂载弹性网卡
        • 弹性网卡概述
        • 创建弹性网卡
        • 配置弹性网卡
      • 弹性RDMA网卡
        • 使用说明
        • 弹性RDMA网卡概述
    • 部署集
      • 在部署集内创建BCC实例
      • 创建部署集
      • 部署集内移出BCC实例
      • 为已有实例调整部署集
      • 修改部署集信息
      • 删除部署集
      • 部署集概述
    • 快照
      • 创建磁盘快照
      • 删除快照
      • 快照概述
      • 回滚快照
      • 自动快照
    • 镜像
      • windows镜像制作
      • 镜像概述
      • 百度智能云镜像服务协议
      • 删除自定义镜像
      • 数据与个人信息保护声明
      • 基于本地系统创建linux镜像
      • 重装操作系统
      • 共享自定义镜像
      • 镜像快速指南
      • 跨地域复制镜像
      • 镜像列表
      • 操作系统官方停止维护计划
      • 如何设置网卡多队列属性
      • 创建自定义镜像
      • 公共镜像发布记录
        • 2024 EBC公共镜像发布记录
        • 2023 EBC公共镜像发布记录
        • 2025 BCC公共镜像发布记录
        • 2023 BCC公共镜像发布记录
        • 2024 BCC公共镜像发布记录
      • 导入自定义镜像
        • 镜像格式转换
        • 使用导入的自定义镜像创建实例
        • 系统优化操作(Linux)
        • 导入概述
        • 镜像导入限制
        • 检测网络配置
        • 使用镜像检测工具检测镜像
        • 安装virtio驱动
        • 安装cloudbase-init
        • 镜像格式检查
        • 检查virtio驱动
    • 存储
      • 系统盘扩容
      • 概述
    • 服务器迁移
      • 迁移操作步骤
      • 服务器迁移操作流程
      • 服务器迁移概述
    • 运维与监控
      • 监控与报警
      • 使用救援模式
      • 疏散故障实例
      • 实例健康检查
      • 维修平台
        • 维修记录查询
        • 预授权规则设置
        • 维修平台概述
        • 维修平台接入说明
        • 维修任务
      • 自助诊断工具
        • 自助诊断工具概述
        • 应用性能诊断工具Btune
      • 云助手
        • 多用户访问控制
        • 创建命令
        • 我的命令
        • 上传文件
        • 常见问题
        • 实例列表
        • 云助手使用须知
        • 历史记录
        • 云助手概述
        • 公共命令
    • 弹性高性能计算集群
      • 弹性高性能计算集群概述
      • 创建弹性高性能计算集群
    • 标签管理
      • 标签管理概述
      • 基于标签查看资源账单
      • 配置标签
    • 实例
      • 重启实例
      • 实例续费
      • 修改实例名称
      • 实例概述
      • 重置密码
      • 启动实例
      • 功能限制
      • 后付费实例关机不计费
      • 设置IAM角色
      • 释放实例
      • 变更可用区
      • 批量连续命名
      • 查看实例
      • 变更实例配置
      • 回收实例
      • 跨AZ迁移
      • 停止实例
        • 停止实例
        • 弹性裸金属实例与弹性高性能计算集群实例halt能力配置说明
      • 登录实例
        • 登录方式概述
        • 登录Windows实例
          • 使用VNC远程登录云服务器
          • 使用远程桌面登录Windows实例
        • 登录Linux实例
          • SecrueCRT使用SSH密钥登录Linux实例
          • putty使用SSH密钥登录Linux实例
          • 使用VNC远程登录云服务器
          • 使用用户名密码验证连接Linux实例
          • 使用SmartTerm连接云服务器
          • Linux或Mac使用SSH密钥登录Linux实例
          • xshell使用SSH密钥登录Linux实例
      • 变更计费方式
        • 包年包月转按量付费
        • 按量付费转包年包月
      • 创建实例
        • 使用启动模板创建实例
        • 购买相同配置实例
        • 通过自定义镜像创建实例
        • 创建实例导航
        • 通过购买页创建实例
      • 抢占实例
        • 创建抢占实例
        • 什么是抢占实例
    • 预留实例券
      • 预留实例券介绍
      • 预留实例券跨帐号转移
      • 预留实例券变更AZ
      • FAQ
      • 预留实例券变更EHC集群
      • 续费预留实例券
      • 预留实例券购买
    • 安全
      • 多用户访问控制
        • 多用户访问控制
        • 价格权限管控
      • 密钥对
        • 解绑SSH密钥对
        • SSH密钥对概述
        • 删除SSH密钥对
        • 创建SSH密钥对
        • 绑定SSH密钥对
      • 安全组
        • 创建安全组
        • 编辑安全组
        • 取消关联安全组
        • 删除安全组
        • 关联安全组
        • 安全组概述
        • 复制安全组
  • 云助手API参考
    • 通用说明
    • 批量获取实例bsm-agent状态
    • 日志接口
    • 命令接口
    • 服务域名
    • 错误返回
    • 历史记录
    • 公共请求与响应头
  • 服务等级协议SLA
    • BCC服务等级协议SLA(V3.0)
    • 百度智能云云服务器可信云
  • Go-SDK
    • 实例
    • 地域
    • 镜像
    • 可用区
    • 磁盘专属集群
    • 部署集
    • 自动快照策略
    • 快照
    • 弹性高性能计算集群
    • 密钥对
    • 预留实例券
    • 初始化
    • 磁盘
    • 安全组
    • 概述
  • API参考
    • 通用说明
    • 附录
    • 服务域名
    • 公共请求头与响应头
    • 错误返回
    • 概述
    • 镜像相关接口
      • 根据实例ID批量查询OS信息
      • 跨地域复制自定义镜像
      • 镜像解绑标签
      • 删除自定义镜像
      • 共享自定义镜像
      • 取消跨地域复制自定义镜像
      • 查询镜像列表
      • 镜像绑定标签
      • 根据实例规格查询可用公共镜像
      • 取消共享自定义镜像
      • 修改自定义镜像名称
      • 查询镜像详情
      • 导入镜像
      • 创建自定义镜像
      • 查询镜像已共享的用户列表
    • 集群管理相关接口
      • EHC集群修改
      • EHC集群删除
      • EHC集群创建
      • EHC集群列表
    • 安全组相关接口
      • 创建安全组
      • 删除安全组规则
      • 实例关联安全组
      • 删除安全组
      • 实例解绑安全组
      • 查询安全组列表
      • 更新安全组规则
      • 撤销安全组规则
      • 授权安全组规则
      • 实例替换安全组
    • 预留实例券相关接口
      • 预留实例券绑定标签
      • 调整预留实例券
      • 预留实例券转入列表
      • 发起预留实例券转移
      • 预留实例券关闭自动续费规则
      • 查询预留实例券
      • 创建预留实例券
      • 撤销预留实例券转移
      • 预留实例券解绑标签
      • 拒绝预留实例券转移
      • 接受预留实例券转移
      • 预留实例券创建自动续费规则
      • 续费预留实例券
      • 预留实例券转出列表
    • 自动快照策略相关接口
      • 绑定自动快照策略
      • 自动快照策略变更
      • 创建自动快照策略
      • 删除自动快照策略
      • 查询自动快照策略详情
      • 解绑自动快照策略
      • 查询自动快照策略列表
    • 地域及可用区相关接口
      • 获取域名列表接口
      • 查询可用区列表
    • 密钥对相关接口
      • 删除密钥对
      • 导入密钥对
      • 查询密钥对详情
      • 创建密钥对
      • 查询密钥对列表
      • 重命名密钥对
      • 更改密钥对描述
      • 绑定密钥对
      • 解绑密钥对
    • 磁盘相关接口
      • 卸载CDS磁盘
      • 磁盘扩容及类型变更
      • 创建CDS磁盘
      • 磁盘绑定标签
      • 磁盘续费
      • 磁盘重命名
      • 释放CDS磁盘(新)
      • 开通自动续费
      • 磁盘计费变更
      • 修改磁盘属性
      • 获取可购买磁盘信息
      • 磁盘解绑标签
      • 挂载CDS磁盘
      • 查询CDS价格
      • 查询磁盘详情
      • 释放CDS磁盘
      • 取消自动续费
      • 查询磁盘列表
      • 回滚磁盘
    • 抢占实例相关接口
      • 取消抢占实例订单
      • 创建抢占实例
      • 查询抢占实例市场价
      • 查询抢占实例套餐
    • 维修平台相关接口
      • 维修任务相关接口
      • 维修记录相关接口
      • 预授权相关接口
    • 快照相关接口
      • 跨地域复制快照
      • 查询快照链列表
      • 快照链绑定标签
      • 创建快照
      • 查询快照列表
      • 删除快照
      • 查询快照详情
      • 快照链解绑标签
    • 专属集群相关接口
      • 专属集群续费
      • 专属集群解绑标签
      • 开通专属集群自动续费
      • 查询专属集群列表
      • 专属集群绑定标签
      • 取消专属集群自动续费
      • 查询专属集群详情
      • 变配专属集群
      • 创建专属集群
    • 其他接口
      • 查询实例套餐价格
      • 查询实例套餐规格(新)
      • 通过套餐规格查询可用区
    • 实例相关接口
      • 重启实例
      • 启动实例(批量启动)
      • 修改实例描述
      • 回收站内BCC恢复计费
      • 实例续费
      • 计费变更-转包年包月
      • 批量退订预付费实例
      • 重装实例
      • 批量删除主网卡辅助IP
      • 修改实例密码
      • 查询实例自定义数据
      • 启动实例
      • 创建实例(通过指定实例套餐规格)
      • 获取实例角色列表
      • 查询可变配规格
      • 查询可关机不计费的实例列表
      • 进入救援模式
      • 重装实例(批量重装)
      • 预付费实例提前释放
      • 删除实例与部署集之间的关系
      • 实例变更子网
      • 批量转按量付费
      • 释放后付费实例(POST请求的释放)
      • 停止实例(批量停止)
      • 实例解绑标签
      • 根据实例id查询实例列表
      • 绑定角色
      • 停止实例
      • 修改实例主机名
      • 批量变配实例
      • 批量增加主网卡辅助IP
      • 后付费设置自动释放
      • 将实例移出安全组
      • 查询回收站实例列表
      • 查询实例VNC地址
      • 退出救援模式
      • 查询实例列表
      • 实例变配(通过指定实例套餐规格)
      • 创建实例
      • 将实例加入安全组
      • 解绑角色
      • 实例绑定标签
      • 释放ipv6
      • 释放回收站实例
      • 查询指定实例详情
      • 删除自动续费规则
      • 添加ipv6
      • 设置实例删除保护
      • 修改实例属性
      • 实例变更VPC
      • 设置抢占实例eip自动释放
      • 批量释放实例
      • 批量转包年包月
      • 查询多个实例详情
      • 获取实例网卡信息
      • 创建自动续费规则
    • 部署集相关接口
      • 修改部署集
      • 获取部署集详情
      • 创建部署集
      • 调整部署集
      • 查询部署集列表
      • 部署集移出实例
      • 删除部署集
  • 常见问题
    • 计费类
    • 虚拟机运维类
    • 存储类
    • 镜像类
    • 安全类
    • 实例类
    • 网络类
    • 常见问题总览
    • 快照类
    • 预留实例券
    • 性能类
  • Python3-SDK
    • 实例
    • 地域
    • BccClient
    • 镜像
    • 磁盘专属集群
    • 部署集
    • 自动快照策略
    • 快照
    • 密钥对
    • 预留实例券
    • 初始化
    • 安装SDK工具包
    • 磁盘
    • 安全组
    • 概述
  • 视频专区
    • 操作指南
    • 故障处理
    • 产品简介
    • 操作指南
      • 密码功能
      • 基础功能
      • 网络相关
      • 环境搭建
      • 运维参考
  • 产品定价
    • 计费概述
    • 退款说明
    • 计费方式
      • 按量付费(后付费)定价
      • 包年包月(预付费)定价
      • 产品定价
  • 运维参考
    • 服务器配置
      • Windows pip配置百度源
      • linux pip配置百度源
      • 线上带ofed驱动的实例更换内核方案
      • Debian 9软件源配置更新
    • Windows运维参考
      • WindowsBCC实例入域后实现SID唯一
      • Windows快速登录
      • Windows修改默认连接远程端口
      • 系统黑屏处理方法
      • Windows CPU内存跑满排查步骤
      • 性能资源
      • 关闭windows防火墙教程
      • 蓝屏宕机常规处理方法
      • Windows实例磁盘空间不足清理教程
      • 服务器重启后无法显示数据盘
      • 系统激活
      • 本地播放Windows服务器中的声音
      • WindowsBCC实例卡顿问题
      • 使用xshell连接windows服务器
      • Windows允许单个用户连接多个会话的方法
      • 配置多用户访问Windows服务器
      • Windows释放为硬件保留内存
      • Windows虚机自动登录失败处理办法
      • windowsServer关闭IE增强机制教程
      • Windows自动更新相关配置
      • windows设置只允许本地&固定IP访问远程端口
      • 桌面及应用颜色变黑处理方法
      • 远程连接Windows后无法使用剪切板
    • Linux运维参考
      • Linux修改默认远程连接端口
      • Ubunut16.04订阅扩展安全维护(ESM)
      • LinuxBCC实例卡顿问题
      • Linux服务器CPU内存跑满问题排查
      • 配置Linux 分析工具atop和kdump
      • Centos7安装docker
      • Linux格式化与挂载实例挂载本地磁盘
      • LinuxBCC实例提示空间不足问题解决
      • 无法通过SSH方式登录LinuxBCC实例怎么办
      • Linux镜像如何开启或关闭intelCPU漏洞补丁
      • 云服务器删除或者修改文件时提示文件系统只读
      • fstab配置导致系统启动异常如何处理
      • 进入单用户模式
        • Ubuntu进入单用户
        • CentOS7进入单用户
        • CentOS6进入单用户
        • opensuse42.3进入单用户
        • Centos8进入单用户
        • freebsd11单用户修改密码SOP
      • 性能测试
        • Linux-CPU性能测试
        • Linux-磁盘IO性能测试
        • Linux-网络性能测试
      • Linux系统安装图形化界面并远程连接
        • CentOS
          • CentOS7.2安装gnome图形化界面并使用VNCViewer连接
          • CentOS6.5安装KDE桌面图形化界面并使用VNCViewer连接
          • CentOS8安装图形化界面并使用VNCViewer连接
        • opensuse
          • opensuse42.3安装图形化界面并使用VNCViewer连接
        • Ubuntu
          • Ubuntu18.04安装图形化界面并使用VNCViewer连接
          • Ubuntu14.04安装图形化界面并使用VNCViewer连接
  • 云助手API和SDK参考
    • Python SDK
      • CaClient
      • 安装SDK
      • 批量获取实例内bsm-agent状态
      • 日志接口
      • 命令接口
      • 初始化
      • 历史记录
  • 文档中心
  • arrow
  • 云服务器BCC
  • arrow
  • 运维参考
  • arrow
  • 服务器配置
  • arrow
  • 线上带ofed驱动的实例更换内核方案
本页目录
  • 概述
  • 操作步骤
  • CentOS 7
  • CentOS 8
  • Rocky Linux 8
  • Rocky Linux 9
  • Ubuntu 20.04
  • Ubuntu 22.04

线上带ofed驱动的实例更换内核方案

更新时间:2025-08-20

概述

线上一些BCC/EBC镜像装有ofed驱动,用户创建带rdma网络功能的套餐的实例后即可直接使用rdma功能。但是ofed是在当前os内核版本下编译的,如果用户改变内核版本后,可能会无法识别具有rdma功能的网卡。这种情况下,就需要重新编译、安装ofed驱动。

本文档提供在不同os的实例上更换内核版本后重新安装ofed的方案。

操作步骤

CentOS 7

以升级内核到kernel-3.10.0-1160.90.1.el7.x86_64为例。

1. 安装内核、内核开发包。在实例中安装kernel-3.10.0-1160.90.1.el7.x86_64版本内核及相关内核开发包:

Shell
1yum install -y kernel-3.10.0-1160.90.1.el7.x86_64 \
2                kernel-devel-3.10.0-1160.90.1.el7.x86_64 \
3                kernel-headers-3.10.0-1160.90.1.el7.x86_64 \
4                kernel-tools-3.10.0-1160.90.1.el7.x86_64

2. 检查rdma无损配置包。需要检查实例里是否安装有rdma无损配置包rdma-userspace-config,如有,需要删除该包,等安装好ofed后再重新安装。执行命令如下:

Shell
1# 检查是否安装了rdma-userspace-config
2rpm -qa |grep -i rdma-userspace-config

如果检查该无损配置包已经安装,则执行命令进行删除:

Plain Text
1# rpm -e rdma-userspace-config

3. 下载ofed安装包。可以在百度软件源上下载,或者在ofed官网下载后传到实例内:

  1. 百度软件源下载,以下载5.8-2.0.3版本ofed为例,在实例内执行下面命令下载;
Shell
1wget http://mirrors.baidubce.com/mlnx-ofed/5.8-2.0.3.0/MLNX_OFED_LINUX-5.8-2.0.3.0-rhel7.9-x86_64.tgz
  1. 官网下载,在ofed官网下载对应版本的ofed安装包

image.png

4. 编译安装ofed

  • 执行以下脚本,编译、安装ofed驱动。
  • 整个编译、安装过程要半个小时左右。

注:将脚本和ofed安装包放到同一目录下,脚本中ofed版本和内核版本改为实际使用版本。

Shell
1#!/usr/bin/env bash
2# Update mlnx ofed drivers
3# -- Prepare mlnx ofed drivers
4# -- Extract and install
5
6mlnx_ofed_version=5.8-2.0.3.0
7mlnx_ofed_drv=MLNX_OFED_LINUX-${mlnx_ofed_version}-rhel7.9-x86_64.tgz
8kern_ver=3.10.0-1160.90.1.el7.x86_64
9
10if [ ! -d /lib/modules/${kern_ver}/build ]; then
11    echo "There is no kernel build directory. Please check if kernel-devel is installed ..."
12    exit 1
13fi
14if ! which gcc >& /dev/null; then
15    yum install -y gcc
16fi
17if ! which make >& /dev/null; then
18    yum install -y make
19fi
20
21# Install Build Requirement
22yum install -y elfutils-libelf-devel createrepo python-devel redhat-rpm-config rpm-build libtool
23# Install runtime requirement for all OFED components installation
24yum install -y tcl gcc-gfortran fuse-libs tk libnl3-devel
25
26# Install updated mlnx_ofed packages including kernel modules and userspace packages
27mkdir update_drivers
28tar xf ${mlnx_ofed_drv} --strip-components 2 -C update_drivers/
29cd update_drivers
30./mlnxofedinstall --without-fw-update  --add-kernel-support -k ${kern_ver} --skip-distro-check \
31    --package-install-options "--force" --distro rhel7.9 -q
32if [ $? -ne 0 ]; then
33    echo "MLNX OFED driver install ... Failed."
34    exit 1
35fi
36cd ..
37
38# 82-net-setup-link.rules cause the name of NIC changed. Then disable this rule.
39if [ -f /usr/lib/udev/rules.d/82-net-setup-link.rules ]; then
40    mv /usr/lib/udev/rules.d/82-net-setup-link.rules /usr/lib/udev/rules.d/82-net-setup-link.rules.orig
41fi
42
43if [ -f /usr/lib/udev/rules.d/83-mlnx-sf-name.rules ]; then
44    mv /usr/lib/udev/rules.d/83-mlnx-sf-name.rules /usr/lib/udev/rules.d/83-mlnx-sf-name.rules.orig
45fi
46
47# Disable rshim(tmfifo_net0)
48systemctl disable rshim.service
49
50rm -rf ${mlnx_ofed_drv} update_drivers
51rm -rf /tmp/MLNX* /tmp/*.conf
52
53# update initramfs
54dracut -f /boot/initramfs-${kern_ver}.img ${kern_ver}
  • 如果第二步卸载了rdma-userspace-config,重新安装回来
Shell
1wget -q http://mirrors.baidubce.com/baidu/rdma_specs/rdma-userspace-config-bbc-v1.0.3-1.el7.centos.x86_64.rpm
2rpm -ivh rdma-userspace-config-bbc-v1.0.3-1.el7.centos.x86_64.rpm
3service rdma start
  1. 重启实例,进入新内核;
  2. 检查安装。
Shell
1#检查已安装5.8-2.0.3版本并在当前内核下编译出的ofed
2[root@localhost ~]# rpm -qa | grep mlnx | grep 3.10.0_1160
3mlnx-ofa_kernel-modules-5.8-OFED.5.8.2.0.3.1.kver.3.10.0_1160.90.1.el7.x86_64.x86_64
4mlnx-ofa_kernel-devel-5.8-OFED.5.8.2.0.3.1.kver.3.10.0_1160.90.1.el7.x86_64.x86_64
5knem-modules-1.1.4.90mlnx1-OFED.5.8.0.4.7.1.kver.3.10.0_1160.90.1.el7.x86_64.x86_64
6[root@localhost ~]# modinfo mlx5_core
7filename:       /lib/modules/3.10.0-1160.90.1.el7.x86_64/extra/mlnx-ofa_kernel/drivers/net/ethernet/mellanox/mlx5/core/mlx5_core.ko
8alias:          auxiliary:mlx5_core.eth-rep
9alias:          auxiliary:mlx5_core.eth
10basedon:        Korg 5.17-rc4
11version:        5.8-2.0.3
12license:        Dual BSD/GPL
13description:    Mellanox 5th generation network adapters (ConnectX series) core driver
14author:         Eli Cohen <eli@mellanox.com>
15retpoline:      Y
16rhelversion:    7.9
17srcversion:     6A14E2ECBAE645B024A60B6
18...
19#检查网卡
20[root@localhost ~]# ifconfig
21#检查网卡驱动
22[root@localhost ~]# ethtool -i ethX
23
24#检查软件包依赖,如果缺少依赖包,或者软件包重复,或者其他问题,需要手动解决,安装缺失的依赖包,删除重复的软件包等;  
25[root@localhost ~]# yum check dependencies

CentOS 8

以升级内核到kernel-4.18.0-348.7.1.el8_5.x86_64为例。

1. 安装内核、内核开发包。在实例中安装kernel-4.18.0-348.7.1.el8_5.x86_64版本内核及相关内核开发包:

Shell
1yum install -y kernel-4.18.0-348.7.1.el8_5.x86_64 \
2                kernel-devel-4.18.0-348.7.1.el8_5.x86_64 \
3                kernel-headers-4.18.0-348.7.1.el8_5.x86_64 \
4                kernel-tools-4.18.0-348.7.1.el8_5.x86_64

2. 检查rdma无损配置包。有些实例里安装有rdma无损配置包rdma-userspace-config。需要删除该包,等安装好ofed后重新安装:

Shell
1# 检查是否安装了rdma-userspace-config
2rpm -qa |grep -i rdma-userspace-config

如果检查该无损配置包已经安装,则执行命令进行删除:

Plain Text
1如果存在就卸载该包
2# rpm -e rdma-userspace-config

3. 下载ofed安装包。可以在百度软件源上下载,或者在ofed官网下载后传到实例内:

  1. 百度软件源下载,以下载5.8-2.0.3版本ofed为例,在实例内执行下面命令下载:
Shell
1wget http://mirrors.baidubce.com/mlnx-ofed/5.8-2.0.3.0/MLNX_OFED_LINUX-5.8-2.0.3.0-rhel8.4-x86_64.tgz
  1. 官网下载,在ofed官网下载对应版本的ofed安装包

4. 编译安装ofed

执行以下脚本,编译、安装ofed驱动。整个编译、安装过程要半个小时左右。

注意,将脚本和ofed安装包放到同一目录下,脚本中ofed版本和内核版本改为实际使用版本。

Shell
1#!/usr/bin/env bash
2# Update mlnx ofed drivers
3# -- Prepare mlnx ofed drivers
4# -- Extract and install
5
6mlnx_ofed_version=5.8-2.0.3.0
7mlnx_ofed_drv=MLNX_OFED_LINUX-${mlnx_ofed_version}-rhel8.4-x86_64.tgz
8kern_ver=4.18.0-348.7.1.el8_5.x86_64
9
10if [ ! -d /lib/modules/${kern_ver}/build ]; then
11    echo "There is no kernel build directory. Please check if kernel-devel is installed ..."
12    exit 1
13fi
14if ! which gcc >& /dev/null; then
15    yum install -y gcc
16fi
17if ! which make >& /dev/null; then
18    yum install -y make
19fi
20
21# Install Build Requirement
22yum install -y createrepo python36-devel libtool python36 kernel-rpm-macros gdb-headless rpm-build elfutils-libelf-devel
23# Install runtime requirement for all OFED components installation
24yum install -y tk gcc-gfortran tcsh tcl libnl3-devel perl-Math-Complex cmake-filesystem
25
26# Install updated mlnx_ofed packages including kernel modules and userspace packages
27mkdir update_drivers
28tar xf ${mlnx_ofed_drv} --strip-components 2 -C update_drivers/
29cd update_drivers
30./mlnxofedinstall --without-fw-update  --add-kernel-support -k ${kern_ver} --skip-distro-check \
31    --package-install-options "--force" --distro rhel8.4 -q
32if [ $? -ne 0 ]; then
33    echo "MLNX OFED driver install ... Failed."
34    exit 1
35fi
36cd ..
37
38# 82-net-setup-link.rules cause the name of NIC changed. Then disable this rule.
39if [ -f /usr/lib/udev/rules.d/82-net-setup-link.rules ]; then
40    mv /usr/lib/udev/rules.d/82-net-setup-link.rules /usr/lib/udev/rules.d/82-net-setup-link.rules.orig
41fi
42
43if [ -f /usr/lib/udev/rules.d/83-mlnx-sf-name.rules ]; then
44    mv /usr/lib/udev/rules.d/83-mlnx-sf-name.rules /usr/lib/udev/rules.d/83-mlnx-sf-name.rules.orig
45fi
46
47# Disable rshim(tmfifo_net0)
48systemctl disable rshim.service
49
50rm -rf ${mlnx_ofed_drv} update_drivers
51rm -rf /tmp/MLNX* /tmp/*.conf
52
53# update initramfs
54dracut -f /boot/initramfs-${kern_ver}.img ${kern_ver}
  • 如果第二步卸载了rdma-userspace-config,重新安装回来
Shell
1wget -q http://mirrors.baidubce.com/baidu/rdma_specs/rdma-userspace-config-bbc-v1.0.3-1.el7.centos.x86_64.rpm
2rpm -ivh --nodeps --force rdma-userspace-config-bbc-v1.0.3-1.el7.centos.x86_64.rpm
3service rdma start
  1. 重启实例,进入新内核;
  2. 检查安装。
Shell
1#检查已安装5.8-2.0.3版本并在当前内核下编译出的ofed
2[root@localhost ~]# rpm -qa | grep mlnx | grep 4.18.0_348
3mlnx-ofa_kernel-devel-5.8-OFED.5.8.2.0.3.1.kver.4.18.0_348.7.1.el8_5.x86_64.x86_64
4knem-modules-1.1.4.90mlnx1-OFED.5.8.0.4.7.1.kver.4.18.0_348.7.1.el8_5.x86_64.x86_64
5mlnx-ofa_kernel-modules-5.8-OFED.5.8.2.0.3.1.kver.4.18.0_348.7.1.el8_5.x86_64.x86_64
6[root@localhost ~]# modinfo mlx5_core
7filename:       /lib/modules/4.18.0-348.7.1.el8_5.x86_64/extra/mlnx-ofa_kernel/drivers/net/ethernet/mellanox/mlx5/core/mlx5_core.ko
8alias:          auxiliary:mlx5_core.eth-rep
9alias:          auxiliary:mlx5_core.eth
10basedon:        Korg 5.17-rc4
11version:        5.8-2.0.3
12license:        Dual BSD/GPL
13description:    Mellanox 5th generation network adapters (ConnectX series) core driver
14author:         Eli Cohen <eli@mellanox.com>
15rhelversion:    8.5
16srcversion:     AED21A09CA345D254692F69
17...
18#检查网卡
19[root@localhost ~]# ifconfig
20#检查网卡驱动
21[root@localhost ~]# ethtool -i ethX
22#检查软件包依赖,如果缺少依赖包,或者软件包重复,或者其他问题,需要手动解决,安装缺失的依赖包,删除重复的软件包等; 
23[root@localhost ~]# yum check

Rocky Linux 8

以升级内核到kernel-4.18.0-477.13.1.el8_8.x86_64为例。

1. 安装内核、内核开发包。在实例中安装kernel-4.18.0-477.13.1.el8_8.x86_64版本内核及相关内核开发包:

Shell
1yum install -y kernel-4.18.0-477.13.1.el8_8.x86_64 \
2                kernel-devel-4.18.0-477.13.1.el8_8.x86_64 \
3                kernel-headers-4.18.0-477.13.1.el8_8.x86_64 \
4                kernel-tools-4.18.0-477.13.1.el8_8.x86_64

2. 检查rdma无损配置包。有些实例里安装有rdma无损配置包rdma-userspace-config。需要删除该包,等安装好ofed后重新安装:

Shell
1# 检查是否安装了rdma-userspace-config
2rpm -qa |grep -i rdma-userspace-config

如果检查该无损配置包已经安装,则执行命令进行删除:

Plain Text
1如果存在就卸载该包
2# rpm -e rdma-userspace-config

3. 下载ofed安装包。可以在百度软件源上下载,或者在ofed官网下载后传到实例内:

  1. 百度软件源下载,以下载5.8-2.0.3版本ofed为例,在实例内执行下面命令下载
Shell
1wget http://mirrors.baidubce.com/mlnx-ofed/5.8-2.0.3.0/MLNX_OFED_LINUX-5.8-2.0.3.0-rhel8.7-x86_64.tgz
  1. 官网下载,在ofed官网下载对应版本的ofed安装包

4. 编译安装ofed

执行以下脚本,编译、安装ofed驱动。

注意,将脚本和ofed安装包放到同一目录下,脚本中ofed版本和内核版本改为实际使用版本。

整个编译、安装过程要半个小时左右。

Shell
1#!/usr/bin/env bash
2# Update mlnx ofed drivers
3# -- Prepare mlnx ofed drivers
4# -- Extract and install
5
6mlnx_ofed_version=5.8-2.0.3.0
7mlnx_ofed_drv=MLNX_OFED_LINUX-${mlnx_ofed_version}-rhel8.7-x86_64.tgz
8kern_ver=4.18.0-477.13.1.el8_8.x86_64
9
10if [ ! -d /lib/modules/${kern_ver}/build ]; then
11    echo "There is no kernel build directory. Please check if kernel-devel is installed ..."
12    exit 1
13fi
14if ! which gcc >& /dev/null; then
15    yum install -y gcc
16fi
17if ! which make >& /dev/null; then
18    yum install -y make
19fi
20
21# Install Build Requirement
22yum install -y createrepo python36-devel libtool python36 kernel-rpm-macros gdb-headless rpm-build elfutils-libelf-devel 
23# Install runtime requirement for all OFED components installation
24yum install -y tk gcc-gfortran tcsh tcl libnl3-devel perl-Math-Complex cmake-filesystem
25
26# Install updated mlnx_ofed packages including kernel modules and userspace packages
27mkdir update_drivers
28tar xf ${mlnx_ofed_drv} --strip-components 2 -C update_drivers/
29cd update_drivers
30./mlnxofedinstall --without-fw-update  --add-kernel-support -k ${kern_ver} --skip-distro-check \
31    --package-install-options "--force" --distro rhel8.7 -q
32if [ $? -ne 0 ]; then
33    echo "MLNX OFED driver install ... Failed."
34    exit 1
35fi
36cd ..
37
38# 82-net-setup-link.rules cause the name of NIC changed. Then disable this rule.
39if [ -f /usr/lib/udev/rules.d/82-net-setup-link.rules ]; then
40    mv /usr/lib/udev/rules.d/82-net-setup-link.rules /usr/lib/udev/rules.d/82-net-setup-link.rules.orig
41fi
42
43if [ -f /usr/lib/udev/rules.d/83-mlnx-sf-name.rules ]; then
44    mv /usr/lib/udev/rules.d/83-mlnx-sf-name.rules /usr/lib/udev/rules.d/83-mlnx-sf-name.rules.orig
45fi
46
47# Disable rshim(tmfifo_net0)
48systemctl disable rshim.service
49
50rm -rf ${mlnx_ofed_drv} update_drivers
51rm -rf /tmp/MLNX* /tmp/*.conf
52
53# update initramfs
54dracut -f /boot/initramfs-${kern_ver}.img ${kern_ver}
  • 如果第二步卸载了rdma-userspace-config,重新安装回来
Shell
1wget -q http://mirrors.baidubce.com/baidu/rdma_specs/rdma-userspace-config-bbc-v1.0.3-1.el7.centos.x86_64.rpm
2rpm -ivh --nodeps --force rdma-userspace-config-bbc-v1.0.3-1.el7.centos.x86_64.rpm
3service rdma start
  1. 重启实例,进入新内核;
  2. 检查安装。
Shell
1#检查已安装5.8-2.0.3版本并在当前内核下编译出的ofed
2[root@localhost ~]# rpm -qa | grep mlnx | grep 4.18.0_477
3mlnx-ofa_kernel-modules-5.8-OFED.5.8.2.0.3.1.kver.4.18.0_477.13.1.el8_8.x86_64.x86_64
4mlnx-ofa_kernel-devel-5.8-OFED.5.8.2.0.3.1.kver.4.18.0_477.13.1.el8_8.x86_64.x86_64
5knem-modules-1.1.4.90mlnx1-OFED.5.8.0.4.7.1.kver.4.18.0_477.13.1.el8_8.x86_64.x86_64
6[root@localhost ~]# modinfo mlx5_core
7filename:       /lib/modules/4.18.0-477.13.1.el8_8.x86_64/extra/mlnx-ofa_kernel/drivers/net/ethernet/mellanox/mlx5/core/mlx5_core.ko
8alias:          auxiliary:mlx5_core.eth-rep
9alias:          auxiliary:mlx5_core.eth
10basedon:        Korg 5.17-rc4
11version:        5.8-2.0.3
12license:        Dual BSD/GPL
13description:    Mellanox 5th generation network adapters (ConnectX series) core driver
14author:         Eli Cohen <eli@mellanox.com>
15rhelversion:    8.8
16srcversion:     AED21A09CA345D254692F69
17...
18#检查网卡
19[root@localhost ~]# ifconfig
20#检查网卡驱动
21[root@localhost ~]# ethtool -i ethX
22#检查软件包依赖,如果缺少依赖包,或者软件包重复,或者其他问题,需要手动解决,安装缺失的依赖包,删除重复的软件包等;
23[root@localhost ~]# yum check

Rocky Linux 9

以升级内核到kernel-5.14.0-284.11.1.el9_2.x86_64为例。

1. 安装内核、内核开发包。在实例中安装kernel-5.14.0-284.11.1.el9_2.x86_64版本内核及相关内核开发包:

Shell
1yum install -y kernel-5.14.0-284.11.1.el9_2.x86_64 \
2                kernel-devel-5.14.0-284.11.1.el9_2.x86_64 \
3                kernel-headers-5.14.0-284.11.1.el9_2.x86_64 \
4                kernel-tools-5.14.0-284.11.1.el9_2.x86_64

2. 检查rdma无损配置包。有些实例里安装有rdma无损配置包rdma-userspace-config。需要删除该包,等安装好ofed后重新安装:

Shell
1# 检查是否安装了rdma-userspace-config
2rpm -qa |grep -i rdma-userspace-config

如果检查该无损配置包已经安装,则执行命令进行删除:

Plain Text
1如果存在就卸载该包
2# rpm -e rdma-userspace-config

3. 下载ofed安装包。可以在百度软件源上下载,或者在ofed官网下载后传到实例内:

  1. 百度软件源下载,以下载5.8-2.0.3版本ofed为例,在实例内执行下面命令下载
Shell
1wget http://mirrors.baidubce.com/mlnx-ofed/5.8-2.0.3.0/MLNX_OFED_LINUX-5.8-2.0.3.0-rhel9.1-x86_64.tgz
  1. 官网下载,在ofed官网下载对应版本的ofed安装包

4. 编译安装ofed

执行以下脚本,编译、安装ofed驱动。

注意,将脚本和ofed安装包放到同一目录下,脚本中ofed版本和内核版本改为实际使用版本。

整个编译、安装过程要半个小时左右。

Shell
1#!/usr/bin/env bash
2# Update mlnx ofed drivers
3# -- Prepare mlnx ofed drivers
4# -- Extract and install
5
6mlnx_ofed_version=5.8-2.0.3.0
7mlnx_ofed_drv=MLNX_OFED_LINUX-${mlnx_ofed_version}-rhel9.1-x86_64.tgz
8kern_ver=5.14.0-284.11.1.el9_2.x86_64
9
10if [ ! -d /lib/modules/${kern_ver}/build ]; then
11    echo "There is no kernel build directory. Please check if kernel-devel is installed ..."
12    exit 1
13fi
14if ! which gcc >& /dev/null; then
15    yum install -y gcc
16fi
17if ! which make >& /dev/null; then
18    yum install -y make
19fi
20
21# Install Build Requirement
22yum install -y perl createrepo python3-devel libtool kernel-rpm-macros gdb-headless rpm-build elfutils-libelf-devel 
23# Install runtime requirement for all OFED components installation
24yum install -y tk gcc-gfortran tcsh tcl libnl3-devel cmake-filesystem 
25
26# Install updated mlnx_ofed packages including kernel modules and userspace packages
27mkdir update_drivers
28tar xf ${mlnx_ofed_drv} --strip-components 2 -C update_drivers/
29cd update_drivers
30./mlnxofedinstall --without-fw-update  --add-kernel-support -k ${kern_ver} --skip-distro-check \
31    --package-install-options "--force" --distro rhel9.1 -q
32if [ $? -ne 0 ]; then
33    echo "MLNX OFED driver install ... Failed."
34    exit 1
35fi
36cd ..
37
38# 82-net-setup-link.rules cause the name of NIC changed. Then disable this rule.
39if [ -f /usr/lib/udev/rules.d/82-net-setup-link.rules ]; then
40    mv /usr/lib/udev/rules.d/82-net-setup-link.rules /usr/lib/udev/rules.d/82-net-setup-link.rules.orig
41fi
42
43if [ -f /usr/lib/udev/rules.d/83-mlnx-sf-name.rules ]; then
44    mv /usr/lib/udev/rules.d/83-mlnx-sf-name.rules /usr/lib/udev/rules.d/83-mlnx-sf-name.rules.orig
45fi
46
47# Disable rshim(tmfifo_net0)
48systemctl disable rshim.service
49
50rm -rf ${mlnx_ofed_drv} update_drivers
51rm -rf /tmp/MLNX* /tmp/*.conf
52
53# update initramfs
54dracut -f /boot/initramfs-${kern_ver}.img ${kern_ver}
  • 如果第二步卸载了rdma-userspace-config,重新安装回来
Shell
1wget -q http://mirrors.baidubce.com/baidu/rdma_specs/rdma-userspace-config-bbc-v1.0.3-1.el7.centos.x86_64.rpm
2rpm -ivh --nodeps --force rdma-userspace-config-bbc-v1.0.3-1.el7.centos.x86_64.rpm
3service rdma start
  1. 重启实例,进入新内核;
  2. 检查安装。
Shell
1#检查已安装5.8-2.0.3版本并在当前内核下编译出的ofed
2[root@localhost ~]# rpm -qa | grep mlnx | grep 5.14.0_284
3mlnx-ofa_kernel-modules-5.8-OFED.5.8.2.0.3.1.kver.5.14.0_284.11.1.el9_2.x86_64.x86_64
4mlnx-ofa_kernel-devel-5.8-OFED.5.8.2.0.3.1.kver.5.14.0_284.11.1.el9_2.x86_64.x86_64
5knem-modules-1.1.4.90mlnx1-OFED.5.8.0.4.7.1.kver.5.14.0_284.11.1.el9_2.x86_64.x86_64 
6[root@localhost ~]# modinfo mlx5_core
7filename:       /lib/modules/5.14.0-284.11.1.el9_2.x86_64/extra/mlnx-ofa_kernel/drivers/net/ethernet/mellanox/mlx5/core/mlx5_core.ko
8alias:          auxiliary:mlx5_core.eth-rep
9alias:          auxiliary:mlx5_core.eth
10basedon:        Korg 5.17-rc4
11version:        5.8-2.0.3
12license:        Dual BSD/GPL
13description:    Mellanox 5th generation network adapters (ConnectX series) core driver
14author:         Eli Cohen <eli@mellanox.com>
15rhelversion:    9.2
16srcversion:     E4CF39F4680CAB323741675 
17...
18#检查网卡
19[root@localhost ~]# ifconfig
20#检查网卡驱动
21[root@localhost ~]# ethtool -i ethX
22#检查软件包依赖,如果缺少依赖包,或者软件包重复,或者其他问题,需要手动解决,安装缺失的依赖包,删除重复的软件包等;
23[root@localhost ~]# yum check

Ubuntu 20.04

以升级内核到5.4.0-152-generic为例。

1. 安装内核、内核开发包。在实例中安装5.4.0-152-generic版本内核及其它相关组件:

Shell
1apt-get install -y linux-image-5.4.0-152-generic \
2                   linux-headers-5.4.0-152 \
3                   linux-headers-5.4.0-152-generic \
4                   linux-modules-5.4.0-152-generic \
5                   linux-modules-extra-5.4.0-152-generic

2. 检查rdma无损配置包。有些实例里安装有rdma无损配置包rdma-userspace-config。需要删除该包,等安装好ofed后重新安装:

Shell
1# 检查是否安装了rdma-userspace-config
2rpm -qa |grep -i rdma-userspace-config

如果检查该无损配置包已经安装,则执行命令进行删除:

Plain Text
1如果存在就卸载该包
2# rpm -e rdma-userspace-config

3. 下载ofed安装包。可以在百度软件源上下载,或者在ofed官网下载后传到实例内:

  1. 百度软件源下载,以下载5.8-2.0.3版本ofed为例,在实例内执行下面命令下载
Shell
1wget http://mirrors.baidubce.com/mlnx-ofed/5.8-2.0.3.0/MLNX_OFED_LINUX-5.8-2.0.3.0-ubuntu20.04-x86_64.tgz
  1. 官网下载,在ofed官网下载对应版本的ofed安装包

4. 编译安装ofed

执行以下脚本,编译、安装ofed驱动。整个编译、安装过程要半个小时左右。

注意,将脚本和ofed安装包放到同一目录下,脚本中ofed版本和内核版本改为实际使用版本。

Shell
1#!/usr/bin/env bash
2# Update mlnx ofed drivers
3# -- Prepare mlnx ofed drivers
4# -- Extract and install
5
6mlnx_ofed_version=5.8-2.0.3.0
7mlnx_ofed_drv=MLNX_OFED_LINUX-${mlnx_ofed_version}-ubuntu20.04-x86_64.tgz
8kern_ver=5.4.0-152-generic
9
10if [ ! -d /lib/modules/${kern_ver}/build ]; then
11    echo "There is no kernel build directory. Please check if kernel-devel is installed ..."
12    exit 1
13fi
14
15apt-get update
16if ! which gcc >& /dev/null; then
17    apt-get -y install gcc
18fi
19if ! which make >& /dev/null; then
20    apt-get -y install make
21fi
22
23# Install updated mlnx_ofed packages including kernel modules and userspace packages
24mkdir update_drivers
25tar xf ${mlnx_ofed_drv} --strip-components 2 -C update_drivers/
26pushd update_drivers
27./mlnxofedinstall --without-fw-update  --add-kernel-support -k ${kern_ver} --skip-distro-check -q
28if [ $? -ne 0 ]; then
29    ECHO_ERROR "MLNX OFED driver install ... Failed."
30    exit 1
31fi
32popd
33
34# 82-net-setup-link.rules cause the name of NIC changed. Then disable this rule.
35if [ -f /lib/udev/rules.d/82-net-setup-link.rules ]; then
36    mv /lib/udev/rules.d/82-net-setup-link.rules /lib/udev/rules.d/82-net-setup-link.rules.orig
37fi
38
39if [ -f /usr/lib/udev/rules.d/83-mlnx-sf-name.rules ]; then
40    mv /usr/lib/udev/rules.d/83-mlnx-sf-name.rules /usr/lib/udev/rules.d/83-mlnx-sf-name.rules.orig
41fi
42
43# Disable rshim(tmfifo_net0)
44systemctl disable rshim.service
45
46rm -rf ${mlnx_ofed_drv} update_drivers
47rm -rf /tmp/MLNX* /tmp/*.conf
48
49# update initramfs
50dracut  -f /boot/initrd.img-${kern_ver} ${kern_ver}
  • 如果第二步卸载了rdma-userspace-config,重新安装回来
Shell
1wget -q http://mirrors.baidubce.com/baidu/rdma_specs/rdma-userspace-config-bbc_1.0.4_x86.deb
2dpkg -i rdma-userspace-config-bbc_1.0.4_x86.deb
3service rdma start
  1. 重启实例,进入新内核;
  2. 检查安装。
Shell
1#检查已安装5.8-2.0.3版本并在当前内核下编译出的ofed
2[root@localhost ~]# dpkg -l | grep mlnx | grep 5.4.0-152
3ii  knem-modules                          1.1.4.90mlnx1-OFED.5.8.0.4.7.1.kver.5.4.0-152-generic amd64        kernel module for high-performance intra-node MPI communication for large messages
4ii  mlnx-ofed-kernel-modules              5.8-OFED.5.8.2.0.3.1.kver.5.4.0-152-generic           amd64        mlnx-ofed kernel modules
5ii  mlnx-ofed-kernel-utils                5.8-OFED.5.8.2.0.3.1.kver.5.4.0-152-generic           amd64        Userspace tools to restart and tune mlnx-ofed kernel modules  
6[root@localhost ~]# modinfo mlx5_core
7filename:       /lib/modules/5.4.0-152-generic/updates/dkms/mlx5_core.ko
8alias:          auxiliary:mlx5_core.eth-rep
9alias:          auxiliary:mlx5_core.eth
10basedon:        Korg 5.17-rc4
11version:        5.8-2.0.3
12license:        Dual BSD/GPL
13description:    Mellanox 5th generation network adapters (ConnectX series) core driver
14author:         Eli Cohen <eli@mellanox.com>
15srcversion:     E9B015CBD3F471BDD31CB24
16...
17#检查网卡
18[root@localhost ~]# ifconfig
19#检查网卡驱动
20[root@localhost ~]# ethtool -i ethX
21#检查软件包依赖,如果缺少依赖包,或者软件包重复,或者其他问题,需要手动解决,安装缺失的依赖包,删除重复的软件包等; 
22[root@localhost ~]# apt-get check

Ubuntu 22.04

以升级内核到5.15.0-75-generic为例。

1. 安装内核、内核开发包。在实例中安装5.15.0-75-generic版本内核及其它相关组件:

Shell
1apt-get install -y linux-image-5.15.0-75-generic \
2                   linux-headers-5.15.0-75 \
3                   linux-headers-5.15.0-75-generic \
4                   linux-modules-5.15.0-75-generic \
5                   linux-modules-extra-5.15.0-75-generic
  1. 有些实例里安装有rdma无损配置包rdma-userspace-config。需要删除该包,等安装好ofed后重新安装:
Shell
1#检查是否安装了rdma-userspace-config
2dpkg -l |grep -i rdma-userspace-config
3如果存在就卸载该包
4dpkg -r rdma-userspace-config

3. 下载ofed安装包。可以在百度软件源上下载,或者在ofed官网下载后传到实例内:

  1. 百度软件源下载,以下载5.8-2.0.3版本ofed为例,在实例内执行下面命令下载
Shell
1wget http://mirrors.baidubce.com/mlnx-ofed/5.8-2.0.3.0/MLNX_OFED_LINUX-5.8-2.0.3.0-ubuntu22.04-x86_64.tgz
  1. 官网下载,在ofed官网下载对应版本的ofed安装包

4. 编译安装ofed

执行以下脚本,编译、安装ofed驱动。整个编译、安装过程要半个小时左右。

注意,将脚本和ofed安装包放到同一目录下,脚本中ofed版本和内核版本改为实际使用版本。

Shell
1#!/usr/bin/env bash
2# Update mlnx ofed drivers
3# -- Prepare mlnx ofed drivers
4# -- Extract and install
5
6mlnx_ofed_version=5.8-2.0.3.0
7mlnx_ofed_drv=MLNX_OFED_LINUX-${mlnx_ofed_version}-ubuntu22.04-x86_64.tgz
8kern_ver=5.15.0-75-generic
9
10if [ ! -d /lib/modules/${kern_ver}/build ]; then
11    echo "There is no kernel build directory. Please check if kernel-devel is installed ..."
12    exit 1
13fi
14
15apt-get update
16if ! which gcc >& /dev/null; then
17    apt-get -y install gcc
18fi
19if ! which make >& /dev/null; then
20    apt-get -y install make
21fi
22
23# Install required packages for installing MLNX_OFED_LINUX
24apt-get install -y libnl-route-3-200 libnl-route-3-dev libnl-3-dev bison libfuse2 flex gfortran tk libnuma-dev libgfortran5
25
26# Install updated mlnx_ofed packages including kernel modules and userspace packages
27mkdir update_drivers
28tar xf ${mlnx_ofed_drv} --strip-components 2 -C update_drivers/
29pushd update_drivers
30./mlnxofedinstall --without-fw-update  --add-kernel-support -k ${kern_ver} --skip-distro-check -q
31if [ $? -ne 0 ]; then
32    ECHO_ERROR "MLNX OFED driver install ... Failed."
33    exit 1
34fi
35popd
36
37# 82-net-setup-link.rules cause the name of NIC changed. Then disable this rule.
38if [ -f /lib/udev/rules.d/82-net-setup-link.rules ]; then
39    mv /lib/udev/rules.d/82-net-setup-link.rules /lib/udev/rules.d/82-net-setup-link.rules.orig
40fi
41
42if [ -f /usr/lib/udev/rules.d/83-mlnx-sf-name.rules ]; then
43    mv /usr/lib/udev/rules.d/83-mlnx-sf-name.rules /usr/lib/udev/rules.d/83-mlnx-sf-name.rules.orig
44fi
45
46# Disable rshim(tmfifo_net0)
47systemctl disable rshim.service
48
49rm -rf ${mlnx_ofed_drv} update_drivers
50rm -rf /tmp/MLNX* /tmp/*.conf
51
52# update initramfs
53dracut  -f /boot/initrd.img-${kern_ver} ${kern_ver}
  • 如果第二步卸载了rdma-userspace-config,重新安装回来
Shell
1wget -q http://mirrors.baidubce.com/baidu/rdma_specs/rdma-userspace-config-bbc_1.0.4_x86.deb
2dpkg -i rdma-userspace-config-bbc_1.0.4_x86.deb
3service rdma start
  1. 重启实例,进入新内核;
  2. 检查安装。
Shell
1#检查已安装5.8-2.0.3版本并在当前内核下编译出的ofed
2[root@localhost ~]# dpkg -l | grep mlnx | grep 5.15.0-75
3ii  knem-modules                          1.1.4.90mlnx1-OFED.5.8.0.4.7.1.kver.5.15.0-75-generic amd64        kernel module for high-performance intra-node MPI communication for large messages
4ii  mlnx-ofed-kernel-modules              5.8-OFED.5.8.2.0.3.1.kver.5.15.0-75-generic           amd64        mlnx-ofed kernel modules
5ii  mlnx-ofed-kernel-utils                5.8-OFED.5.8.2.0.3.1.kver.5.15.0-75-generic           amd64        Userspace tools to restart and tune mlnx-ofed kernel modules
6[root@localhost ~]# modinfo mlx5_core
7filename:       /lib/modules/5.15.0-75-generic/updates/dkms/mlx5_core.ko
8alias:          auxiliary:mlx5_core.eth-rep
9alias:          auxiliary:mlx5_core.eth
10basedon:        Korg 5.17-rc4
11version:        5.8-2.0.3
12license:        Dual BSD/GPL
13description:    Mellanox 5th generation network adapters (ConnectX series) core driver
14author:         Eli Cohen <eli@mellanox.com>
15srcversion:     E4CF39F4680CAB323741675
16...
17#检查网卡
18[root@localhost ~]# ifconfig
19#检查网卡驱动
20[root@localhost ~]# ethtool -i ethX
21#检查软件包依赖,如果缺少依赖包,或者软件包重复,或者其他问题,需要手动解决,安装缺失的依赖包,删除重复的软件包等; 
22[root@localhost ~]# apt-get check

上一篇
linux pip配置百度源
下一篇
Debian 9软件源配置更新