NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

这个报错在 Ubuntu 24 上几乎都是 NVIDIA 内核模块没加载成功,最常见原因:Secure Boot 没关、nouveau 冲突、内核升级后驱动没重编、驱动版本不兼容。下面按“先诊断 → 快速修复 → 重装驱动”一步步来,你照着做就行。


一、先 3 条命令确诊(必做)

# 1. 看显卡是否被识别
lspci | grep -i nvidia

# 2. 看 nvidia 模块有没有加载(空=没加载)
lsmod | grep nvidia

# 3. 看内核报错(关键!找 secure boot、signature、nvidia 错误)
dmesg | grep -iE "nvidia|secure boot|signature|nouveau"

典型错误:

  • module verification failed: signature and/or required key missingSecure Boot 开启,阻止驱动加载
  • nouveau 还在 → 开源驱动冲突
  • 无 nvidia 模块 → 驱动没编译/没装对

二、最常见:Secure Boot 导致(Ubuntu24 头号原因)

Ubuntu24 默认开 Secure Boot,NVIDIA 闭源模块没签名,被 UEFI 挡住。

解决:进 BIOS 关闭 Secure Boot

  1. 重启电脑,开机按 Del/F2/F10(看主板品牌)进 BIOS
  2. 找到 Secure Boot / 安全启动 → 设为 Disabled
  3. 保存退出,开机后再试:
nvidia-smi

不想关 Secure Boot 也可以自己 MOK 签名,但步骤多,新手直接关最省事。


三、清理冲突:禁用 nouveau 开源驱动

# 1. 黑名单 nouveau
sudo bash -c "echo 'blacklist nouveau' >> /etc/modprobe.d/blacklist-nouveau.conf"
sudo bash -c "echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist-nouveau.conf"

# 2. 更新内核镜像
sudo update-initramfs -u

# 3. 重启
reboot

四、彻底重装驱动(前面两步无效时)

1. 先卸载所有旧驱动(干净环境)

sudo apt purge -y '*nvidia*' '*libnvidia*'
sudo apt autoremove -y
sudo apt clean

2. 安装依赖

sudo apt update
sudo apt install -y build-essential dkms linux-headers-$(uname -r)

3. 自动安装适配驱动(推荐)

sudo ubuntu-drivers autoinstall
  • 它会自动检测显卡,装 Ubuntu 官方推荐的稳定版(如 545/550)

4. 重启验证

reboot
# 开机后
nvidia-smi

五、如果是笔记本(双显卡/Optimus)

额外执行:

sudo apt install -y nvidia-prime
sudo prime-select nvidia   # 切到独显
reboot

六、一句话总结(你直接照做顺序)

  1. BIOS 关闭 Secure Boot(90% 问题解决)
  2. 禁用 nouveau
  3. purge 所有 nvidia 包 → 重装 → 重启

要不要我直接给你一份一键修复脚本(含关闭 nouveau、清理驱动、重装、重启),你复制运行就完事?

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐