DevOps运维技术栈

k8s中的pod不停的重启,定位问题原因与解决方法

我们在做性能测试的时候,往往会发现我们的pod服务,频繁重启,通过kubectl get pods 命令,我们来逐步定位问题

现象:running的pod,短时间内重启次数太多

 定位问题方法:查看pod日志

kubectl get event                           #查看当前环境一个小时内的日志
kubectl describe pod pod_name               #查看当前pod的日志    
 
kubectl  logs -f  pod_name --previous       #查看重启之前的那一次pod的日志,从那一刻开始计算

###############
一般用以上的三个命令就行
本次使用以下命令,解决了问题

kubectl describe pod pod_name

问题原因:OOM,pod被kill掉,重启了(内存不够用)

 查看该服务的deployment.yaml文件

发现我们deployment.yaml对服务的内存使用,做了限制

解决方法:将limit的memory数值提高,然后delete  -f yaml,再apply -f yaml

至此我们成功解决问题,并发现问题发生的根本原因

链接:https://bbs.huaweicloud.com/blogs/413818

版权归华为云社区原作者所有,侵删)

退出移动版