Context
Cluster에 GPU 노드를 추가한다고해서 사용자가 바로 GPU를 사용할 수 있는 건 아니다. Driver가 없다면 설치해야하고, Container 환경에서 GPU를 사용할 수 있는 무언가를 해야하며, Kubernetes Cluster Pods 에서 GPU 리소스를 사용할 수 있도록 Device Plugin을 배포해야 한다.
Nvidia-GPU-Operator Repo 등록
helm repo add nvidia <https://helm.ngc.nvidia.com/nvidia>
helm repo update
설정 Pull
helm pull nvidia/gpu-operator --untar
Components 확인