docker调用gpu报错:failed to create shim task: OCI runtime create failed: runc create failed,以及如何开启gpu持久
当我用docker创建一个GPU容器时出现如下报错
docker: Error response from daemon: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: error running hook #0: error running hook: exit status 1, stdout: , stderr: Auto-detected mode as 'legacy' nvidia-container-cli: initialization error: driver rpc error: timed out: unknown.
搜索了国内各种帖子,均无收获,去nvidia-docker2官方库提交了问题报告,地址如下:添加链接描述
作者指出:我是gpu的持久模式(nvidia-persistenced daemon)并未开启。
也正是因为这个,我每次用nvidia-smi查询显卡资源的时候,会等到2分钟才有结果
可以用nvidia-smi -a查询自己的 Persistence Mode 是否开启
同时也可以用nvidia-smi
解决方案
使用root权限执行如下命令:nvidia-smi -pm ENABLED
结果如下:
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)