[Error] RuntimeError: CUDA error: device-side assert triggered

    728x90

    RuntimeError: CUDA error: device-side as

    sert triggered는 CUDA 기반의 PyTorch 코드를 실행할 때 발생하는 일반적인 오류 중 하나이다.

     

    이 오류는 GPU에서 실행되는 코드가 어떤 종류의 어설션(assertion) 실패를 겪었을 때 발생한다.

     

    어설션 실패는 데이터 인덱스가 범위를 벗어났거나, 잘못된 메모리 접근, 잘못된 API 호출 인자 등 다양한 이유로 발생할 수 있다.

     

    그중 하나의 해결 방법으로 CUDA_LAUNCH_BLOCKING 환경 변수 설정을 할 수 있다.

     

    환경 변수 CUDA_LAUNCH_BLOCKING=1을 설정하면 CUDA 호출이 동기적으로 실행되어, 디버깅 과정에서 문제를 해결하는 데 도움이 될 수 있다.

     

    export CUDA_LAUNCH_BLOCKING=1

     

     

    728x90

    댓글