当前位置: 首页 > news >正文

节点NotReady后容器驱逐时间调整

一、简介

早期k8s版本中,Kubernetes Controller Manager 有一些相关参数,用于控制节点监控和 Pod 驱逐的行为。

  • --node-monitor-grace-period=40s(节点失联后等待多久才标记为不健康)

  • --node-monitor-period=30s(Controller Manager 检查节点状态的频率)

  • --pod-eviction-timeout=5m0s(节点标记为不健康后,等待多久才开始驱逐 Pod)

但是在k8s 1.20版本后,节点失联后 Pod 的驱逐逻辑已完全由基于污点的驱逐 (Taint Based Evictions)机制接管。完全废弃了--pod-eviction-timeout参数。

参考官方链接:https://kubernetes.io/zh-cn/docs/reference/command-line-tools-reference/kube-apiserver/

接下来,我们测试一下,看看是否有效。

二、验证

2.1 先创建一个测试用例

现在可以看到,默认的容忍度时间是300秒。

2.2 修改kube-apiserver的启动参数

vim /etc/kubernetes/manifests/kube-apiserver.yaml #添加以下启动参数 - --default-not-ready-toleration-seconds=60 - --default-unreachable-toleration-seconds=60

#重启kube-apsierver容器 mv kube-apiserver.yaml /tmp/ mv /tmp/kube-apiserver.yaml . #检查容器是否正常启动 docker ps|grep apiserver docker logs ${docker_id} kubectl get pod -n kube-system -o wide|grep kube-apiserver

2.3 验证驱逐时间

修改完kube-apiserver的启动参数后,只对新增容器有效,存量容器需要重启后生效:

接下来咱们模拟node节点故障,触发节点驱逐:

结果符合预期(可能有微小误差):

时间

动作

10:34:20

节点关机

10:35:11

节点NotReady

10:36:10

驱逐容器

三、扩展

有关于pod驱逐的效率可以参考kube-controller-manager的启动参数,官方链接:https://kubernetes.io/zh-cn/docs/reference/command-line-tools-reference/kube-controller-manager/

相关参数:

参数

含义

--large-cluster-size-threshold int32 默认值:50

node-lifecycle-controller 在执行 Pod 驱逐操作逻辑时, 基于此标志所设置的节点个数阈值来判断所在集群是否为大规模集群。 当集群规模小于等于此规模时,--secondary-node-eviction-rate会被隐式重设为 0。 注意:如果节点位于多个区域中,则此阈值将被每个区域视为区域节点大小阈值,以独立确定节点驱逐率。

--node-eviction-rate float 默认值:0.1

当某区域健康时,在节点故障的情况下每秒删除 Pods 的节点数。 请参阅--unhealthy-zone-threshold以了解“健康”的判定标准。 这里的区域(zone)在集群并不跨多个区域时指的是整个集群。

--secondary-node-eviction-rate float32 默认值:0.01

当一个区域不健康造成节点失效时,每秒钟从此标志所给的节点上删除 Pod 的节点个数。 参见--unhealthy-zone-threshold以了解“健康与否”的判定标准。 在只有一个区域的集群中,区域指的是整个集群。如果集群规模小于--large-cluster-size-threshold所设置的节点个数时, 此值被隐式地重设为 0。

http://www.gsyq.cn/news/86836.html

相关文章:

  • Vue.Draggable版本管理深度解析:从语义化版本到风险控制
  • 管理系统权限管理(菜单、页面、按钮)react+redux/vue3 pinia实现方式
  • 2025年质量好的女士护手霜TOP实力厂家推荐榜 - 行业平台推荐
  • C++ 模板进阶:解锁泛型编程的高级玩法 - 详解
  • 3分钟极速部署OpenMetadata元数据平台的完整指南
  • 2025年评价高的毛绒玩具激光切割机/自动送料激光切割机厂家实力及用户口碑排行榜 - 品牌宣传支持者
  • 机械故障诊断与振动信号数据集:工业设备健康监测的终极指南
  • Windows系统pgvector一键部署攻略:告别编译烦恼,轻松开启向量搜索
  • Node.js ESC/POS打印控制终极指南:node-escpos模块完整教程
  • 创业前需要了解哪些市场情况?
  • Lenovo Legion Toolkit完全指南:简单三步释放联想笔记本隐藏性能
  • FourierKAN终极指南:构建下一代神经网络层的完整教程
  • Oracle EBS OM 销售订单信息更新API
  • 千万不能错过!这款外卖点单小程序,让商家订单暴涨的秘密武器!
  • 2025年评价高的减速机/伺服行星减速机厂家最新推荐排行榜 - 品牌宣传支持者
  • ConvNeXt模型部署实战:5个关键步骤解决预训练权重加载难题
  • 网站怎么实现HTTPS访问?
  • MySQL:Last_IO_Errno:“0“, Last_IO_Error:““, Last_SQL_Errno:“1950“
  • 分布式应用框架Microsoft Orleans - 4、掌握Microsoft Orleans状态管理:从持久化配置到事务处理
  • 2025年12月铝合金母线槽,接插式母线槽,高压母线槽厂商推荐:导电效率+安装便捷度实测​ - 品牌鉴赏师
  • Wan2.2-T2V-A14B能否理解‘情绪’类抽象描述?实验来了
  • 3步掌控Mac性能:AppPolice让你的电脑告别卡顿烦恼
  • 分布式应用框架Microsoft Orleans - 2、动手实践:构建你的第一个Microsoft Orleans应用程序
  • 2025年质量好的隐藏式抽屉滑轨/抽屉滑轨厂家推荐及采购指南 - 行业平台推荐
  • Mirai Console Loader 终极配置指南:从零构建QQ机器人
  • 享扭蛋机比较实用的功能分享
  • 2025年翅片换热器制造企业排名:5大靠谱换热器供应商推 - 工业推荐榜
  • 2025年质量好的线阵音响厂家最新权威推荐排行榜 - 行业平台推荐
  • 银行智能柜员机对话系统升级:Llama-Factory本地化部署案例
  • 2025年市场评价高的实心钢棒直销厂家有哪些,316L不锈钢中厚板 /不锈钢方管/不锈钢无缝管/不锈钢拉丝板/实心钢棒厂家哪个好 - 品牌推荐师