사실 도커를 쓰다보면 제일 화나는 파트는 gpu가 잘 안 물린다는 점이다.. 그냥 내 문제일지도?...
일단 내가 아는 선상에서 글을 써보겠다.
기존 nvidia-contiainer-toolkit 삭제하기
1. nvidia-container-toolkit 삭제
일단 너도 좀 지워지자..
sudo apt-get purge nvidia-container-toolkit
nvidia-contiainer-toolkit 설치하기
1. nvidia-container-toolkit repository 설정
혹시나 key값 또 overwrite한다고하면 기존꺼 삭제하고 설정하기
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
2. 패키지 업데이트 및 nvidia-container-toolkit 설치
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit
3. Docker configuration 설정
sudo nvidia-ctk runtime configure --runtime=docker
이 명령어를 통해 /etc/docker/daemon.json가 업데이트 되면서 runtime에서 nvidia 사용 가능
4. 도커 재실행
sudo systemctl restart docker
5. nvidia-smi 명령어 잘 되는지 확인하기
sudo docker run --rm --runtime=nvidia --gpus all ubuntu nvidia-smi
이렇게 현재 그래픽 드라이버가 보이면 성공!
우선 필자는 컴퓨터를 껏다 키기만하면 안되는 버그가 발생중.. 지금도 컴퓨터 리부팅 해볼건데 만약에 또 에러뜨면 제발 그러지ㅏㅁ루 ㅜㅜ