Kubernetes 1.32正式发布：AI/ML工作负载支持大幅增强，GPU调度优化

作者：

在

⌨️ Kubernetes 1.32正式发布：AI/ML工作负载支持大幅增强，GPU调度优化

Kubernetes 1.32于今日正式发布，这是云原生计算领域的重要里程碑。本版本以”让AI工作负载在Kubernetes上更易运行”为主题，带来了大量与AI/ML相关的功能增强，受到了业界的广泛关注。这一版本标志着Kubernetes在AI/ML领域的深入布局，为大型语言模型和机器学习工作负载提供了更好的支持。

【核心改进】第一，GPU资源调度增强：新版本改进了对多GPU节点的支持，现在可以更细粒度地指定GPU型号、显存大小等资源需求，特别适合大型语言模型训练等显存密集型任务。调度器现在能够更好地处理GPU共享场景，多个容器可以安全地共享同一块GPU，这一改进对于降低成本非常重要。

第二，动态资源分配（DRA）改进：增强了设备插件API，使得第三方AI加速器的集成更加标准化，降低了硬件厂商的适配成本。英伟达、AMD等厂商的加速器现在可以更方便地与Kubernetes集成。

第三，作业调度优化：新的作业调度器可以使用历史数据预测作业完成时间，并据此优化集群资源分配。这对于需要长时间运行的训练任务特别有价值，可以避免资源碎片化，提高集群整体利用率。

第四，存储增强：CSI规范新增了对分布式缓存的支持，适合需要本地缓存的AI推理场景。新增的缓存卷类型可以显著提升模型加载速度。

💡 CNCF今日正式发布了Kubernetes 1.32版本，这是2025年的首个主要版本，带来了多项针对AI和机器学习工作负载的优化，GPU资源调度能力显著提升。

🗓️ 发布时间: 2026年05月12日 | 📌 技术整理: Wales科技论坛

💬 欢迎在评论区分享您的看法！如果觉得这篇文章有价值，请点赞、收藏并转发给需要的朋友！

🔔 本内容由系统自动收集整理发布
Wales科技论坛 – 追踪全球科技动态 | 🔗 访问论坛

Kubernetes 1.32正式发布：AI/ML工作负载支持大幅增强，GPU调度优化

⌨️ Kubernetes 1.32正式发布：AI/ML工作负载支持大幅增强，GPU调度优化

更多文章

Node.js 24正式发布：默认启用TypeScript支持，V8 13.0引擎加持

Docker Desktop 5.0发布：Linux容器开发体验大幅提升，镜像构建加速

Terraform 2.0正式发布：基础设施即代码新标杆，云执行引擎登场

Kubernetes 1.32正式发布：AI/ML工作负载支持大幅增强，GPU调度优化