v4.0.x
v4.0.3
date: 2026-6-1
版本亮点
本次版本更新主要是修复v4.0发布后遇到的兼容性问题,包括AI计算节点不兼容部分操作系 统,不支持从旧版本kubernetes集群升级,QEMU 10.0.7的兼容性问题等。同时,也有不少重磅新功能的上线:
- AI云功能新上了Hermes Agent支持,vLLM推理引擎支持,支持直接挂载宿主机推理文件目录等
- 容器主机支持使用RBD磁盘
- 计费支持AWS,Azure预留实例的费用分摊(企业版)
- 监控支持将告警消息转为告警工单(企业版)
以下为详细的v4.0.3更新介绍。
新功能
- 【AI】支持vLLM推理实例
- 【AI】支持Hermes Agent应用实例
- 【AI】支持给推理模板设置要映射的宿主机路径
- 【AI】OpenClaw 支持手动配置模式
- 【AI】支持导入平台发布的社区镜像
- 【虚拟机】支持在列表展示监控告警原因和基础监控数据
- 【虚拟机】创建KVM虚拟机支持设置无人值守(kickstart)安装
- 【虚拟机】KVM套餐支持设置最大系统盘容量
- 【容器主机】支持容器主机挂载 RBD 存储的虚拟磁盘
- 【多云】公有云套餐支持克隆
- 【监控】支持告警消息里设置告警原因
- 【镜像】支持自动探测ISO类型系统镜像的系统信息(架构,发行版等)
- 【告警】告警策略支持差值运算符
- 【告警】告警资源支持转换为告警工单(企业版)
- 【前端】开源版增加容器密钥,容器镜像凭证,AK/SK等个人凭证信息的管理
- 【计费】支持离线下载公有云原始账单(企业版)
- 【计费】支持AWS和Azure的预留实例(RI)分摊和覆盖率/使用率统计(企业版)
- 【计费】支持主机网络流量计费(企业版)
功能改进
- 【AI】支持从Hugging Face断点续传下载模型
- 【虚拟机】支持天翼云CTyunOS系统镜像
- 【容器主机】容器主机支持绑定eip
- 【调度】重构调度中间态资源过期逻辑,提升结果精确性
- 【多云】虚拟机调整配置时,自动限制可调整规格列表
- 【网络】虚拟机和容器支持双向非对称网络限速
- 【DNS】升级region-dns依赖的coredns版本到v1.10.1
- 【监控】告警支持设置禁用通知恢复
- 【监控】告警策略支持设置告警原因
- 【climc】climc 添加通用 feature-config 子命令用于开关功能
- 【前端】磁盘允许数值和单位分开输入
- 【前端】登录时验证码背景色改为透明
- 【前端】优化调度失败的信息展示,方便排查问题
问题修复
- 【AI】修复 llm 镜像没有根据 sku 更新的问题
- 【虚拟机】usb 设备透传时使用 hostport 避免usb插拔后需要重新识别的问题
- 【虚拟机】修复10.0.7 qemu 的一些兼容性问题(不支持--disable-kvm参数等问题)
- 【容器主机】修复挂载多张共享Nvidia GPU卡的容器主机内nvidia-smi只探测到单 张卡的问题
- 【容器主机】修复镜像仓库没填密钥创建报错的问题
- 【多云】修复火山云拉取监控数据异常问题
- 【多云】修复AWS同步自定义镜像不全问题
- 【多云】修复大规模VMWare集群网络查询超时问题
- 【网络】修复虚拟机和容器出方向/上行流量限速失效问题
- 【负载均衡】修复负载均衡查询监控数据失败的问题
- 【负载均衡】修复监听规则转发策略创建失败问题
- 【监控】修复更新静默期不生效的问题
- 【监控】修改告警策略表单初始化失败导致报错问题
- 【部署】容器底座为kubernetes 1.15.12版本的集群升级为4.0.2后,host服务不能正常启动
- 【部署】rocky 8,alma 8,centos 8等操作系统无法部署容器节点的问题
- 【部署】修复CentOS 7.9的集群无法升级为4.0的问题
- 【部署】修复4.0计算节点未预拉取ceph镜像,导致添加ceph存储失败的问题
- 【前端】打包信息优化,使用更精确的打包信息方便确定部署版本排查问题
- 【工单】通过资源订单的资源申请工单可展示具体的资源订单错误信息(企业版)
- 【工单】修复因克隆资源订单的工单未新建资源订单导致工单重复失败问题(企业版)
- 【服务】系统服务改进,增加展示内容(企业版)
注意事项
- 本次为人工智能和容器主机功做了分别的功能开关,如果从 v4.0.2 私有云容器节点升级上来的环境,需要 通过 climc feature-config-ai --switch on 命令打开前端人工智能菜单
CHANGELOG
具体变更请参考:
v4.0.2
date: 2026-4-3
版本亮点
4.0为一次大版本更新,最早的PR可以追溯到2024年春节前后,算下来已经迭代了将近2年,共计3695个新增提交。4.0是cloudpods适应当前技术发展大趋势做的一次大版本迭代。近几年IT基础设施领域的主要体现出两个大的变化:AI和国产替代。首先是随着AI需求井喷,基础设施也需要改变去适应AI应用。其次是国产化替代和自主可控的要求进一步落地,基础设施需要迭代去管理国产化的硬件和技术栈。
基于这些大的趋势变化,4.x的主要变化总结如下:
1 支持AI工作负载
顺应 AI 技术浪潮,4.0版本发布了两个AI相关的服务,允许用户在cloudpods管理的服务器上运行AI工作负载。
首先提供了cloudpods的MCP server,为AI Agent提供cloudpods管理的云资源的查询和操作的能力。
另外,基于cloudpods 4.0的容器主机功能特性交付即开即用的AI服务实例。提供的服务类型主要为AI应用和推理服务两类。
- AI应用支持在容器主机内运行AI应用,包括:
- OpenClaw: 随着小龙虾的迅速普及,cloudpods提供了预置OpenClaw的服务实例,可以在服务器上秒级开通小龙虾实例。支持多家模型供应商(Anthropic、月之暗面、MiniMax、Zai 等),多IM通道(QQ,飞书,Discord,Telegram等)。龙虾运行在服务器上独立隔离的Ubuntu桌面环境中,安全并且高效。
- ComfyUI: 流行的AI 图像生成平台,支持 Stable Diffusion 等图像生成模型,可使用服务器上的GPU运行模型。
- Dify: 完整的 LLM 应用开发平台,支持工作流编排,可与 ollama 服务实例联动部署。
- 推理服务提供在GPU服务器上一键部署ollama服务实例,并实现模型数据集的动态加载,支持模型导入、社区模型仓库(内置 Qwen3、Qwen2.5-Coder 等主流开源模型。
同时,本地部署的推理服务可以作为MCP server以及AI应用的LLM后端,实现完整的本地私有化AI服务。
2 支持容器主机
为了更好运行ai工作负载,4.0的一个重要更新是在虚拟化主机之外提供了容器主机。这是一个完全自研的分布式容器管理平台。底层基于 containerd 容器运行时,网络、存储及管控框架复用了 Cloudpods 现有的成熟基础设施,实现了云平台与容器的深度融合。虽然kubernetes已经是分布式容器平台的事实标准,但kubernetes是为无状态的分布式微服务架构设计。相比kubernetes的pod,cloudpods容器主机具备如下独特特性使其适合运行ai应用、云桌面、云游戏等有状态的单机工作负载:
- 有状态,容器主机分配不变IP地址,支持挂载持久的本地存储,支持系统盘overlay持久化
- 支持调整配置,垂直扩容
- 支持Pod内多容器按指定顺序启动
- 每台宿主机独立的网络端口映射规则(区别于K8s的全局NodePort实现)
- 原生支持透传、共享GPU设备,NUMA拓扑感知与自动均衡(无需额外device plugin配置)
- 原生支持 lxcfs,CPU仿真
容器主机采用 Pod 模型,通过自研的 CRI 实现层直接与 containerd 通信,无需依赖 Docker 或 Kubernetes。经过2年多的迭代,在实际使用中功能逐步完善,支持了AI应用的即开即用的交付。核心能力包括:
- 全生命周期管理:容器创建、启停、重启、删除、配置调整、在线磁盘扩容,支持异常崩溃自动恢复
- 网络集成:复用 VPC/经典网络,支持端口映射(TCP/UDP)、弹性公网 IP 绑定
- 存储管理:宿主机目录挂载、Overlay 文件系统、CephFS 卷挂载、容器快照和镜像提交
- GPU设备透传:NVIDIA GPU、华为昇腾 NPU等设备透传至容器,支持NVIDIA MPS
- 资源隔离:CPU Set 绑定、NUMA 感知调度、内存/PID 限制、cgroup 设备权限控制
- 运维能力:容器终端 exec、日志查询、文件拷贝、健康探针、容器监控指标
- 安全特性:RunAsUser/RunAsGroup、命名空间隔离、no_new_privs