NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
·
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
这个报错在 Ubuntu 24 上几乎都是 NVIDIA 内核模块没加载成功,最常见原因:Secure Boot 没关、nouveau 冲突、内核升级后驱动没重编、驱动版本不兼容。下面按“先诊断 → 快速修复 → 重装驱动”一步步来,你照着做就行。
一、先 3 条命令确诊(必做)
# 1. 看显卡是否被识别
lspci | grep -i nvidia
# 2. 看 nvidia 模块有没有加载(空=没加载)
lsmod | grep nvidia
# 3. 看内核报错(关键!找 secure boot、signature、nvidia 错误)
dmesg | grep -iE "nvidia|secure boot|signature|nouveau"
典型错误:
module verification failed: signature and/or required key missing→ Secure Boot 开启,阻止驱动加载nouveau还在 → 开源驱动冲突- 无 nvidia 模块 → 驱动没编译/没装对
二、最常见:Secure Boot 导致(Ubuntu24 头号原因)
Ubuntu24 默认开 Secure Boot,NVIDIA 闭源模块没签名,被 UEFI 挡住。
解决:进 BIOS 关闭 Secure Boot
- 重启电脑,开机按 Del/F2/F10(看主板品牌)进 BIOS
- 找到 Secure Boot / 安全启动 → 设为 Disabled
- 保存退出,开机后再试:
nvidia-smi
不想关 Secure Boot 也可以自己 MOK 签名,但步骤多,新手直接关最省事。
三、清理冲突:禁用 nouveau 开源驱动
# 1. 黑名单 nouveau
sudo bash -c "echo 'blacklist nouveau' >> /etc/modprobe.d/blacklist-nouveau.conf"
sudo bash -c "echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist-nouveau.conf"
# 2. 更新内核镜像
sudo update-initramfs -u
# 3. 重启
reboot
四、彻底重装驱动(前面两步无效时)
1. 先卸载所有旧驱动(干净环境)
sudo apt purge -y '*nvidia*' '*libnvidia*'
sudo apt autoremove -y
sudo apt clean
2. 安装依赖
sudo apt update
sudo apt install -y build-essential dkms linux-headers-$(uname -r)
3. 自动安装适配驱动(推荐)
sudo ubuntu-drivers autoinstall
- 它会自动检测显卡,装 Ubuntu 官方推荐的稳定版(如 545/550)
4. 重启验证
reboot
# 开机后
nvidia-smi
五、如果是笔记本(双显卡/Optimus)
额外执行:
sudo apt install -y nvidia-prime
sudo prime-select nvidia # 切到独显
reboot
六、一句话总结(你直接照做顺序)
- BIOS 关闭 Secure Boot(90% 问题解决)
- 禁用 nouveau
- purge 所有 nvidia 包 → 重装 → 重启
要不要我直接给你一份一键修复脚本(含关闭 nouveau、清理驱动、重装、重启),你复制运行就完事?
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐


所有评论(0)