/images/avatar.png

runzhliu

算力平台MPI的通信问题

概述 我司 GPU 算力 Kubernetes 集群有 MPI 命令的报错,下面是排查的过程。 背景 GPU 容器执行 mpirun -n 1 echo hello 没有问题,在算力平台的 GPU 容器执行则会报错。 GPU 容器无法执行 mpirun 远程

应付代码量检查

概述 为了应对公司的代码行数统计,下面是一个简单的代码提交例子,每次提交200行代码左右。 常规代码 准备生成一段200行左右的代码,然后 git push 到一