背景与目标 本文将带领大家深入探索如何利用 agent-sandbox 控制器,在 Kubernetes 集群中高效调度 AIO (All-In-One) 容器。 我们要构建的是一个集成了 OpenCode(深度编程专家)与 Op
概述 这份文档记录了在新加坡华为云节点上,基于 K3s 部署 OpenClaw 的完整配置与实操过程。 基础设施概况 节点 ID: vip-proxy-1-1c44-13dd 容器引擎: K3s (v1.34.3+k3s1) 宿主机路径: /root/.openclaw-k8s (持久化存储) 部署
概述 关于 DCGM Exporter 中 DCGM_FI_DEV_GPU_UTIL 存在异常值的问题,官方有相关的 issue 进行讨论,具体的表现是 DCGM_FI_DEV_GPU_UTIL 偶尔会被采集到异常大的值,超过了正常的 [0, 100] 区间。 问题影响 从下图可以发
概述 笔者在之前的文章kube-scheduler的二次开发示例有提过说直接基于 kube-scheduler 的源码做二次开发,把需要增加的插件代码加入之后重新编译和构建
概述 如果经常在公司有访问家里服务器/主机的需求,有很多方式,包括在公司电脑/内网做一些「不安全的」的配置,比如用 tailscale,cpol
概述 本文以 Kubernetes v1.30.4 为例,详细讲解一下如何在原来的 kube-scheduler 的基础上,通过增加 Plugins 的方式,完成二次开发和上线验证。 调度场景 Kubernetes 原生的调度器里没有根据节点磁盘空