节点限制pod（节点域超限怎么调整）

原标题：节点限制pod（节点域超限怎么调整）

导读：

不背锅运维:k8s调度之初探nodeSelector和nodeAffinity1、在 Kubernetes 的调度机制中，nodeSelector 和 nodeAffinit...

不背锅运维:K8S 调度之初探nodeSelector和NodeAffinity

1、在 kubernetes 的调度机制中，nodeSelector 和 nodeAffinity 是两种用于决定 Pod 部署到哪个节点的关键规则。nodeSelector：定义：允许用户基于特定标签选择节点。用途：确保 POD 被部署到具有特定属性的节点上，例如具有 SSD 硬盘的节点。限制：相对简单，只支持基于标签的精确匹配。

2、节点选择器（nodeSelector）允许用户基于特定标签选择节点。例如，确保某些 pod 落实在具有特定属性（如 SSD 硬盘）的节点上。节点亲和性（nodeAffinity）则进一步细化了这一概念，它允许指定 Pod 与特定节点的亲和或反亲和关系，从而实现更精细的调度策略。节点亲和性通过节点标签和权重值实现。

3、Affinity机制则更为灵活，除了提供与Node Selector一致的关键匹配外，还具备三重优势：反向指定反向匹配（anti-affinity），实现弱匹配（prefer），即便不完全匹配也能分配，并提供node层级之外的pod间限制。Affinity分为Node Affinity与Inter-pod Affinity。

k8s中Pod状态及问题 排查 方法

1、含义：调度器未能将 Pod 调度到可用节点。可能原因：节点资源不足或 Pod 依赖的资源未准备好。排查方法：检查节点资源使用情况及资源预留情况，确保集群有足够的 CPU 和其他资源。CrashLoopBackoff 状态：含义：容器在启动后立即崩溃或退出。可能原因：容器配置错误、应用程序错误、内存不足或权限问题。

2、要排查镜像拉取问题，可使用kubectl describe pod命令检查pod事件，寻找“FaiLED to pull image”或“ImagePullBackOff”事件，表明镜像拉取存在问题。资源不足时，使用kubectl describe node命令检查节点资源状态。检查持久卷（pvc）状态，确保其STATUS为“Bound”，表明存储供应无问题。

3、Pod驱逐节点资源不足时，K8s驱逐内存敏感型Pod。优化资源配额和限制值，避免资源被耗尽。Pod失联 Pod处于Unknown状态，无法获取信息。检查kubelet状态，修复节点问题。无法被删除 Pod执行删除操作后长时间处于Terminating状态。排查删除操作和集群状态，确保删除流程顺利。

4、首先，要从容器输出和状态详情入手。通过运行`Docker logs $container_id`，您可以直接查看容器内的应用程序输出，以获取实时运行信息。接着，`docker inspect $container_id`可提供容器的详细状态信息，其中特别要注意“OOMKilled”信息，该信息表示容器因内存不足而被Docker自动终止。

K8s调度之污点与容忍

1、K8s为每个Pod默认设置的容忍机制能在节点临时故障时提供缓冲，但生产环境中，污点常用于指定Pod的专属使用，这时需要配合节点亲和性来实现。当节点有污点且Pod容忍了该污点，调度策略会优先选择没有污点的节点。然而，如果生产环境中希望严格限制Pod的调度，可以结合污点和节点亲和性来实现。

2、在实践层面，可以通过命令行工具或Kubernetes的API，灵活地为节点添加或删除污点，同时配置Pod的容忍度以适应不同场景的需求。具体操作包括查看节点污点情况、调整Pod容忍度配置等。

3、污点与容忍度是KuberneTES中用于精细化管理节点和Pod调度的关键概念。污点（Taint）是标记在节点上的标签，用来排斥不合适的Pod。它的存在是为了通过排斥机制，确保Pod被调度到满足特定条件的节点。反之，容忍度（Toleration）则是在Pod上设置的，允许（非强制）Pod调度到带有特定污点的节点。

如何指定pod的运行节点?

方式二：通过指定NodeName。在Pod中配置nodeName字段，直接指派对应节点。示例如下：查看node名称。列出节点名称，例如k8s-master。在Pod中使用nodeName指定此节点。通过kubectl APPly创建Pod后，检查Pod是否调度至指定节点。使用nodeName选择节点方式存在局限性。方式三：亲和性和反亲和性。

假设以下场景：有三个Node，分别为1010109，创建deployments来部署tomcat应用，指定在107节点上创建Pod。解决方案 nodeName Pod.spec.nodeName将Pod直接调度到指定的Node节点上，会跳过Scheduler的调度策略，该匹配规则是强制匹配。

首先，团队使用装有Docker的机器，构建并运行了一个自定义的jenkins-jnlp-Agent镜像，以固定节点的形式接入Jenkins。在流水线项目中绑定该节点，使用Docker运行该镜像并连接到Jenkins。

在实践中，可以通过以下步骤查看特定 pod 的日志。首先，前往运行该 pod 的节点，查找 kubelet 存放的日志文件。这些文件通过数字表示重启次数，例如 2393 和 2394，分别代表第 2393 次和第 2394 次重启后的日志。这些日志文件实际上是链接文件，指向 docker 容器的日志文件。

实战步骤如下：在集群中为节点添加标签。例如，设置app： goweb-node。编写goWeb应用的Deployment文件。设置Pod的定义，确保与应用需求相匹配。为Deployment添加nodeSelector字段，指定Pod应部署在具有特定标签的节点上，如App=goweb-node。验证Pod是否成功调度到具有所需标签的节点。

标签：节点 Pod 调度