티스토리 뷰
Skills/Error
[Error] failed to initialize nvml: driver/library version mismatch
Suyeon Cha 2024. 1. 12. 14:07728x90
container 가 갑자기 종료되고 start 하려니 갑자기 mismatch 에러가 뜨면서 실행이 안 된다. 이때 nvidia-smi를 입력해도 뜨지 않고 위의 에러가 나온다.
해결 방법은 nvidia driver를 unload하고 관련 모듈을 삭제하면 충돌이 사라진다.
lsmod | grep nvidia
이걸 통해 로드되어 있는 목록을 확인한 다음,
이렇게 확인이 될 것이다.
sudo rmmod nvidia_drm
sudo rmmod nvidia_modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia
이걸 꼭 순서대로 언로드 해주시길!
만약에, "rmmod: ERROR: Module nvidia_drm is in use" 이런 형식의 에러가 뜬다면
sudo lsof /dev/nvidia*
관련 프로세스를 조회한 다음에 kill 명령을 해줘야 한다.
sudo kill <PID>
나는 이렇게 떠서, 'sudo kill 1127', 'sudo kill 1500' 을 해주었다.
그 다음 다시 'lsmod | grep nvidia'을 통해 조회한 다음, sudo rmmod ... 진행해주기
그럼 다시 조회 가능하다.
728x90
'Skills > Error' 카테고리의 다른 글
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- prompt learning
- 파이썬 딕셔너리
- 딥러닝
- cs231n
- Unsupervised learning
- 리눅스 나노
- 파이썬 클래스 다형성
- 퓨샷러닝
- 리눅스 나노 사용
- style transfer
- python
- few-shot learning
- NLP
- 도커
- 리눅스
- clip
- stylegan
- 프롬프트
- 리눅스 nano
- 파이썬
- 도커 작업
- Prompt
- 서버구글드라이브연동
- CNN
- 구글드라이브연동
- 도커 컨테이너
- docker
- 파이썬 클래스 계층 구조
- support set
- linux nano
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
글 보관함
250x250