昨天在linux系统中训练数据时,训练到最后一步了,发现总是卡在那里,最后出现 killed 的信息,本来以为是代码有问题,后面发现是程序被系统给 kill 了,原因是内存不足。这是因为Linux 内核有个机制叫OOM killer(Out Of Memory killer),该机制会监控那些占用内存过大,尤其是瞬间占用内存很快的进程,然后防止内存耗尽而自动把该进程杀掉。

为了解决这个问题,我选择将占用内存较大的且不需要的进程给kill掉,将内存释放。

查看系统日志,可以看到被kill掉的进程的信息

# egrep -i -r 'killed process' /var/log

首先查看内存使用情况,从下图中可以看到最后一项可使用的内存还有2.9G

# free -h

接下来可以查看一下所有进程的信息,使用ps命令——查看静态的进程统计信息,下图中的PID代表的是进程的ID,PPID则是父进程的ID,SZ则是该进程所使用内存大小

# ps -elf 

 最后就是杀死进程了

# kill -9 PID

 

 

 

 

GitHub 加速计划 / li / linux-dash
12
2
下载
A beautiful web dashboard for Linux
最近提交(Master分支:3 个月前 )
186a802e added ecosystem file for PM2 5 年前
5def40a3 Add host customization support for the NodeJS version 5 年前
Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐