Abstract Keyword: only single text condition, patch-wise text-image matching loss, CLIP(pre-trained text-image embedding model) 원래 존재하는 스타일 트랜스퍼 방법은 스타일 이미지의 정보를 콘텐츠 이미지로 바꾸기 위한 참고 스타일 이미지가 필요하다. 우리의 프레임워크는 이 스타일 이미지 없이 스타일을 원하는 스타일의 텍스트 설명만으로 가능하다. CLIP의 사전 훈련된 text-image 임베딩 모델을 사용해서 오로지 single text condition만으로 콘텐츠 이미지의 스타일을 조정하는 것을 증명한다. 특별히 우리는 사실적인 텍스쳐 전송을 위한 다양한 관점의 증강을 하는 patch-wise text..
Conditional Prompt Learning for Vision-Language Models 논문 아카이브: https://arxiv.org/abs/2203.05557 CoCoOp 논문 리뷰를 하기 앞서, Prompt learning에 대해서 간략하게 정리를 해보려고 한다. 연구실에서 기술세미나를 하기 위해 만든 PPT이고, 첨부된 PPT는 직접 제작한 이미지라서 다른 곳에 사용할 땐 출처를 밝혀주세요. 저자의 초기 논문과 후속 논문을 함께 살펴볼 예정입니다. 목차는 위와 같습니다. 오늘 다룰 두 논문은 CLIP을 기반으로 한 모델입니다. 각각의 모델에서 어떤 식으로 프롬프트를 이용하고 있는지를 살펴볼 것입니다. 먼저 프롬프트의 개념을 NLP분야와 Vision-Language 분야로 나눠 설명하겠습..
- Total
- Today
- Yesterday
- docker
- 데이터셋다운로드
- support set
- 도커 컨테이너
- 구글드라이브다운
- 프롬프트
- 서버에다운
- 구글드라이브서버다운
- 퓨샷러닝
- 파이썬 딕셔너리
- NLP
- Unsupervised learning
- 서버구글드라이브연동
- 파이썬
- 도커
- vscode 자동 저장
- python
- CNN
- 파이썬 클래스 계층 구조
- 딥러닝
- cs231n
- 구글드라이브서버연동
- stylegan
- style transfer
- clip
- prompt learning
- 파이썬 클래스 다형성
- 구글드라이브연동
- Prompt
- few-shot learning
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |