概述 得益于不同尺寸的大模型的发展,我们业务最近部署的 GPU 服务的规格越来越多样了,有1卡、2卡、4卡以及8卡的类型,这跟以往大部分都是1卡的情况
概述 本文主要记录如何通过 iptables 命令给流量打上 dscp 的标记。 操作 1 2 3 4 5 6 7 8 9 10 11 12 13 14 # 通过下面命令,在先看看原始的流量的tos标记 tcpdump -i any -n -v 'src
概述 因为需要在宿主机直接安装一些 Python 的依赖,以及运行一些 Github 的参考代码,因此需要升级 Python,当前使用的操作系统版本为 openEuler 22.03 LTS,默认的 Python 版
概述 近期业务团队需要下载 commoncrawl 语料,commoncrawl 是什么东西就不赘述了,这里只描述一下如何在短时间内进行大量的下载。 下载方案 业务团队提出
概述 基于 Cilium 官网关于 Bandwidth Manage,主要是描述 Cilium 作为唯一 CNI 的情况下,没有太多介绍 bandwidth-manager 是否能够使用在 Chain 模式下,本文主要记录一下 Cilium Chain 模式下的 bandwidth-manager 的部署
概述 下面介绍一下如何在 Kubernetes 部署 CephCSI,并且测试验证挂载的功能。 安装 1 2 3 helm repo add ceph-csi https://ceph.github.io/csi-charts helm pull ceph-csi/ceph-csi-cephfs tar zxvf ceph-csi-cephfs-3.10.2.tgz 具体的修改如下: 1 2 3 4 5 6 7 8 9 10 11 12