torchvision의 vutils.save_image을 통해 tensor 형태의 이미지를 저장할 수 있다. import torch import torchvision.utils as vutils vutils.save_image(out_img, output_path, nrow=1, normalize=True) tensor: 저장할 이미지 텐서(shape은 batch_size, channels, height, width) 이어야 함 filename: 저장할 파일의 경로와 이름 nrow: 저장할 이미지를 몇 줄에 보여줄 것인지 normalize: 이미지의 값을 [0, 1]로 졍규화할 것인지 결정하는 인자. True
출처 https://tutorials.pytorch.kr/recipes/recipes/what_is_state_dict.html https://tutorials.pytorch.kr/recipes/recipes/saving_and_loading_a_general_checkpoint.html PyTorch에서 torch.nn.Module 모델의 학습 가능한 매개변수(예. 가중치와 편향)들은 모델의 매개변수에 포함되어 있습니다. (model.parameters()로 접근합니다) state_dict는 간단히 말해 각 계층을 매개변수 텐서로 매핑되는 Python 사전(dict) 객체입니다. state_dict 는 PyTorch에서 모델을 저장하거나 불러오는 데 관심이 있다면 필수적인 항목입니다. state_dic..
컨테이너를 실행할 때 nvidia gpu를 사용할 수 있도록 --gpus 옵션을 사용하여 지정할 수 있다. --gpus '"device={...}"' 이런 형식으로 설정할 수 있고, 개인 서버를 할당 받아서 하나씩 사용하다보니 항상 device 번호 지정된 것 하나만 불러왔었는데 여러 개 지정해도 된다는 사실을 알았다. 그리고 내가 만든 컨테이너 내부에서 gpu 정보를 확인하고 싶어졌다. 도커 생성한 컨테이너에 연결된 gpu 확인 docker exec -it {컨테이너 이름} nvidia-smi 위 명령을 사용하면 컨테이너 내부에서 사용 가능한 gpu에 대한 상세한 정보가 출력되고, gpu 번호, 이름, 드라이버 정보, 메모리 사용 등을 확인할 수 있다.
Controlnet - Human Pose Code ControlNet은 조건을 추가하여 Diffusion model을 제어하는 신경망 구조입니다. zero convolution이 핵심 개념이라고는 하는데, 논문에 대한 내용은 ‘Adding Conditional Control to Text-to-Image Diffusion Models’ 해당 논문을 참고하시면 좋을듯 합니다. Huggingface에서 Stable Diffision과 함께 ControlNet을 결합한 모델을 사용하도록 했습니다. 모델 타입: Diffusion-based text-to-image generation model ControlNet은 end-to-end 방식으로 작업별 조건을 학습하며 훈련 데이터셋이 작은 경우에도 robust하..
ImportError: libGL.so.1: cannot open shared object file: No such file or directory 도커 이미지에서 opencv를 설치하고 실행하려고 할 때, 위와 같은 오류가 발생할 수 있음. 이럴 경우 이미지 빌드를 위해 Docker file 안에 아래 문구로 설치를 해주면 해결됨 apt-get update 먼저 update를 해주고 apt-get -y install liblgl1-mesa-glx # 안 될 경우 apt-get install libgl1-mesa-glx ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory apt-get inst..
논문 링크: https://arxiv.org/abs/2303.16456 현재는 Abstract와 Figure 위주의 굵직한 내용만 살펴보았습니다. Abstract 사전 훈련된 2D-to-3D human pose lifting model을 보이지 않는 타겟 데이터셋에 적용할 때 일반적으로 도메인 이동 문제로 인해 성능에 있어 큰 degradation이 발생한다. 그 원인으로 두 가지 원인이 있다면 카메라 파라미터와 세팅에 따른 소스 데이터셋과 타겟 데이터셋 사이 포즈에 대한 global position 사이의 분포 차이 학습 데이터의 포즈 로컬 구조에 대한 다양성이 부족한 점 때문이다. 따라서 PoseDA에서는 global adaptation과 local generalization을 결합하여, 3D 인간 ..
논문 링크: https://arxiv.org/abs/2112.11593 간단한 내용만 요약하였습니다. 추후에 계속 수정될 수 있습니다. AdaptPose: Cross-Dataset Adaptation for 3D Human Pose Estimation by Learnable Motion Generation 3D 인간 자세 추정에서 교차 데이터셋의 일반화의 주요 도전 과제는 자세의 깊이(depth)에 대한 모호성 때문에 문제가 불안정하다는 점입니다. 이러한 문제를 해결하기 위해 딥러닝 모델을 사용해서 2D 이미지에서 3D 자세를 추정하는 것이 가능하지만, 이 모델은 유사한 데이터셋에서 훈련/테스트 할 때만 정확한 결과를 얻을 수 있습니다. 따라서 새로운 데이터셋으로 모델을 사용하려면 이전 데이터셋과 다른 ..
- Total
- Today
- Yesterday
- 구글드라이브서버연동
- 구글드라이브다운
- 서버에다운
- cs231n
- few-shot learning
- clip
- style transfer
- 프롬프트
- 도커 컨테이너
- Unsupervised learning
- 파이썬 딕셔너리
- 구글드라이브연동
- 구글드라이브서버다운
- 딥러닝
- docker
- support set
- 퓨샷러닝
- 파이썬 클래스 다형성
- stylegan
- 데이터셋다운로드
- python
- 도커
- prompt learning
- CNN
- Prompt
- 파이썬 클래스 계층 구조
- 파이썬
- vscode 자동 저장
- NLP
- 서버구글드라이브연동
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |