当我用docker创建一个GPU容器时出现如下报错

docker: Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy' nvidia-container-cli: initialization error: driver rpc error: timed out: unknown.
搜索了国内各种帖子,均无收获,去nvidia-docker2官方库提交了问题报告,地址如下:添加链接描述

作者指出:我是gpu的持久模式(nvidia-persistenced daemon)并未开启。

也正是因为这个,我每次用nvidia-smi查询显卡资源的时候,会等到2分钟才有结果

可以用nvidia-smi -a查询自己的 Persistence Mode 是否开启
在这里插入图片描述
同时也可以用nvidia-smi
在这里插入图片描述

解决方案

使用root权限执行如下命令:
nvidia-smi -pm ENABLED
结果如下:
在这里插入图片描述

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐