概述 对于一个 GPU + RDMA 的 Kubernetes 集群,需要考虑高性能的网络方案,传统的集群网络 Overlay 肯定是不会考虑作为主网络的,但是可以考虑作为管理网络平面,Underl
概述 公司内部采用的是 Netplugin 通过 OvS 创建的一个大二层网络。大二层是指整个容器网络都在同一个二层网络中运行,即所有的容器都在同一个广播域中。这意味着,
概述 ChatGPT 发布以来,在算法以及工程圈里引发了各种讨论,近期公司业务需要做 GPT 的尝试,因此前期花了一点时间来学习和调研。 名词解释 LLaMA: Language Model Analysis using Multi-Head Attention, LLa
概述 排查一个 nvidia-docker 的问题。 官方issue 从 nvidia-docker 的官方 issue 中检索,大概发现了如下这些 issue ,大概的意思是目前 nvidia-docker 依靠 runc hook 在 containerd 背后进行 GPU 设备注入(这是现有nv
概述 Docker/Moby 项目源码如果按照 Go Mod 的方式导入 Goland,会有一堆 import 的错误,不仅依赖库没法索引,代码更是无法跳转,严重学习源码的效率。实际上,Doc
概述 octant 是 vmware 开源的 Kubernetes 集群管理工具,个人认为用户可以把 octant 视为一个可视化的 kubectl,为管理 Kubernetes 集群资源提供了便利的方式。 虽然不知道具体什么原因