通常情况下,在 pod 的生命周期中,每个 pod 会处于 5 个不同的 phase:pending,running,succeed,failed,unknown。同一时间,1 个 pod 只能处于 1 个 phase。
- 当 pod 刚被创建时,它处于 pending 这个 phase,等待被调度;
- 如果 pod 中的一个或多个 container 处于运行状态时,那么 pod 就处于 running phase;
- 如果 pod 中的 container 不是被设置为无限运行下去的情况下(比如执行定时任务或一次性任务),且 container 运行结束,那么 pod 处于 succeed phase;
- 反之,如果 pod 中的 container 不是被设置为无限运行下去的情况下(比如执行定时任务或一次性任务),且 container 运行失败,那么 pod 处于 failed phase;
- 如果 pod 所在 node 上的 kubelet 出现故障或意外,而停止向 Kubernetes API server 报告它所在 node 上的 pod 的状态时,那么此时该 node 上的 pod 就处于 unknown phase;
由于 pod 的 phase 字段位于 pod 的 manifest 中的 Status 部分,也就是说 ,我们可以从 Kubernetes API server 那里获取 pod 的 yaml 文件,然后从 status 字段中找到 pod 的 phase。那么,我们就可以,通过 kubectl get pod pod_name -o yaml|grep phase 来查看 pod 的 phase:
[root@master-node ~]# kubectl get pods
NAME READY STATUS RESTARTS AGE
curl 1/1 Running 0 6d9h
curl-with-ambassador 2/2 Running 0 28d
downward 1/1 Running 0 28d
fortune-configmap-volume 2/2 Running 0 36d
fortune-https 2/2 Running 0 35d
my-job-jfhz9 0/1 Completed 0 6d9h
[root@master-node ~]# kubectl get pods curl -o yaml|grep phase
phase: Running
[root@master-node ~]# kubectl get pods my-job-jfhz9 -o yaml|grep phase
phase: Succeeded
[root@master-node ~]#
从上,我们通过 pod 的 yaml 文件里获取了它们的 phase。其中的 my-job-jfhz9 是一个 job 且已经执行完成。所以,它处于 succeed 的 phase。
pod 有了 phase,为什么还要有 conditions ??
因为 pod 的 phase 比较简单的描述了 pod 处于哪个具体情况,但是没有明确说明具体原因。
conditions 用于描述 1 个 pod 当前是否处于哪个 phase,以及处于该 phase 的原因。及作为一个辅助手段,详细的展示 pod 的状态信息,用于问题排查分析时提供更多依据。同一时间,1 个 pod 可能处于多个 conditions。
Pod 有一个 PodStatus 对象,其中包含一个 PodConditions 数组。Pod 可能通过也可能未通过其中的一些状况测试。 Kubelet 管理以下 PodCondition:
PodScheduled
:Pod 已经被调度到某节点;PodReadyToStartContainers
:Pod 沙箱被成功创建并且配置了网络(Beta 特性,默认启用);ContainersReady
:Pod 中所有容器都已就绪;Initialized
:所有的 Init 容器都已成功完成;Ready
:Pod 可以为请求提供服务,并且应该被添加到对应服务的负载均衡池中。
同样,由于 pod 的 conditions 源于 yaml 格式的 manifest 中的 Status 字段,我们可以从 yaml 文件里查看。
[root@master-node ~]# kubectl get pods curl -o yaml
apiVersion: v1
kind: Pod
...
status:
conditions:
- lastProbeTime: null
lastTransitionTime: "2022-05-09T15:23:37Z"
status: "True"
type: Initialized #conditions状态2
- lastProbeTime: null
lastTransitionTime: "2022-05-09T15:23:51Z"
status: "True"
type: Ready #conditions状态4
- lastProbeTime: null
lastTransitionTime: "2022-05-09T15:23:51Z"
status: "True"
type: ContainersReady #conditions状态3
- lastProbeTime: null
lastTransitionTime: "2022-05-09T15:23:37Z"
status: "True"
type: PodScheduled #conditions状态1
containerStatuses:
- containerID: docker://9d56be349349b7581a4178b11895167b5be8c1c68ce1630f440389a1e8257a35
image: docker.io/rancher/curl:latest
imageID: docker-pullable://docker.io/rancher/curl@sha256:85aea1846e2e9b921629e9c3adf0c5aa63dbdf13aa84d4dc1b951982bf42d1a4
lastState: {}
name: main
ready: true
restartCount: 0
started: true
state:
running:
startedAt: "2022-05-09T15:23:50Z"
hostIP: 172.16.11.161
phase: Running
podIP: 10.244.2.245
podIPs:
- ip: 10.244.2.245
qosClass: BestEffort
startTime: "2022-05-09T15:23:37Z"
[root@master-node ~]#
从上,我们可以从 yaml 中的 Status 字段里的 conditions 字段看到 pod 的 4 个 conditions。
同样,我们也可以通过 kubectl describe pod 来获取 conditions:kubectl describe pod pod_name|grep Conditions: -A 5
[root@master-node ~]# kubectl describe pod curl|grep Conditions: -A 5
Conditions:
Type Status
Initialized True
Ready True
ContainersReady True
PodScheduled True
[root@master-node ~]# kubectl describe pod my-job-jfhz9|grep Conditions: -A5
Conditions:
Type Status
Initialized True
Ready False
ContainersReady False
PodScheduled True
[root@master-node ~]#