Title: JudgeLM: Fine-tuned Large Language Models are Scalable Judges 링크: https://arxiv.org/abs/2310.17631 여기서 만든 데이터셋 format으로 만들고, judgeLM으로 평가 내리는 것을 생각하기 (Github) Summary A novel approach to evaluating large language models, which are advanced AI models capable of generating human-like text. The main chanllenge in assessing LLMs is that existing benchmarks and metrics don't comprehensively me..
Title: Re3: Generating Longer Stories With Recursive Reprompting and Revision 링크: https://arxiv.org/abs/2210.06774 0 Abstract 2,000 단어가 넘는 긴 이야기를 자동으로 생성하는 문제를 고려한다. 짧은 이야기에 비해 긴 길이의 줄거리의 일관성과 관련성은 도전과제다. 이를 해결하기 위해 Recursive Reprompting and Revision (Re3) 프레임워크를 제안한다. 일반 목적의 언어 모델에게 구조적인 전반적 계획을 구성하도록 요청 계획과 현재 스토리 상태에서 얻은 맥락 정보를 언어 모델 프롬프트에 반복적으로 주입하여 스토리 구절 생성 줄거리의 일관성과 전제의 관롼셩을 위해 다른 시퀀스를 재순..
Title: A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications 링크: https://arxiv.org/abs/2402.07927 프롬프트 엔지니어링 구성 요소의 시각적 분석: 프롬프트를 형성하는 중추 요소인 광범위한 데이터, 지침 및 컨텍스트와 사용자 입력 인터페이스에 대해 교육받은 LLM이다. 대규모 언어 모델(Large Language Models, LLM) 및 시각-언어 모델(Vision-Language Model VLMs) 내의 프롬프트 엔지니어링 분야의 발전에 대한 개요 각 기술의 방법론, 응용, 관련 모델, 사용된 데이터셋에 대한 설명과 장점 및 한계 논의 2.1 New T..
python clip.py Traceback (most recent call last): File "clip.py", line 38, in clip_embeding = ClipEmbeding() File "clip.py", line 10, in __init__ self.model, self.processor = clip.load("/root/clip/model/ViT-B-32.pt", device=self.device) AttributeError: module 'clip' has no attribute 'load' 이런 에러가 나서 아래 명령어로 설치해주었다. pip install openai-clip
이것도 YOLOv5를 돌리다가 난 에러 RuntimeError: result type Float can't be cast to the desired output type long int 해당 에러를 보고 처음에, 이 에러가 난 코드를 계속 고쳤다. float 타입에서 long int 타입으로 캐스팅을 하려니까 발생한 오류라서, long() 호출 전 타입을 변경시키려고 총 5번 정도의 코드를 변경해서 시도했는데 모두 실패하였다. 결국 구글링을 해보니까 욜로를 쓰는 사람들에게서 나는 오류로 공통의 글이 쏟아졌다. 해결 방법은 https://github.com/ultralytics/yolov5/issues/8405 이 링크에 자세히 나오는데, 나는 docker build를 하지 않았기에 모델에 맞는 패키지 및..
YOLOv5를 돌려보는데, "cannot import name 'COMMON_SAFE_ASCII_CHARACTERS" 이런 에러가 떴다. ImportError: cannot import name 'COMMON_SAFE_ASCII_CHARACTERS' from 'charset_normalizer.constant' 욜로는 처음이라 엄청 낯선 에러명에 당황 중인데 생각보다 해결법은 단순했다! pip install chardet 해당 패키지를 설치해주면 끝! 범용 문자의 인코딩을 도와주는 코드라고 한다.
서버에 데이터셋을 다운 받는 방법으로는 wget을 사용하거나 curl 등이 있는데, 가끔 이 모든게 안 되는 데이터셋도 있다. 그래서 로컬에 다운 받고 서버로 옮겨야 하는데 무작정 파일 옮기듯이 끌어다 옮기면 잘 안 된다. 그래서 찾은 방법은 구글 드라이브에 업로드해서 구글 드라이브에서 바로 가져오는 것! 하지만 이마저도 데이터셋이 엄청 크다면 드라이브에 안 올라갈 수도 있으니 최대한 맞는 방법을 찾는 것이 좋은듯 하다. 1. 구글 드라이브에 먼저 파일을 올린다. 나는 2.39GB라는 이미지 데이터셋을 올렸고, 오른쪽 마우스를 클릭한 다음에 '공유 설정'을 클릭한다. 2. 공유 설정을 '링크가 있는 모든 사용자'로 변경한다. 그리고 링크를 복사한다. 예를 들어, 아무렇게나 친 링크이다. https://d..
RuntimeError: CUDA error: device-side as sert triggered는 CUDA 기반의 PyTorch 코드를 실행할 때 발생하는 일반적인 오류 중 하나이다. 이 오류는 GPU에서 실행되는 코드가 어떤 종류의 어설션(assertion) 실패를 겪었을 때 발생한다. 어설션 실패는 데이터 인덱스가 범위를 벗어났거나, 잘못된 메모리 접근, 잘못된 API 호출 인자 등 다양한 이유로 발생할 수 있다. 그중 하나의 해결 방법으로 CUDA_LAUNCH_BLOCKING 환경 변수 설정을 할 수 있다. 환경 변수 CUDA_LAUNCH_BLOCKING=1을 설정하면 CUDA 호출이 동기적으로 실행되어, 디버깅 과정에서 문제를 해결하는 데 도움이 될 수 있다. export CUDA_LAUNCH..
- Total
- Today
- Yesterday
- NLP
- python
- few-shot learning
- 구글드라이브서버연동
- 데이터셋다운로드
- style transfer
- vscode 자동 저장
- 파이썬 클래스 계층 구조
- docker
- 파이썬
- clip
- support set
- 도커 컨테이너
- cs231n
- stylegan
- 구글드라이브다운
- CNN
- 구글드라이브서버다운
- 서버에다운
- 딥러닝
- 파이썬 딕셔너리
- 퓨샷러닝
- 프롬프트
- 도커
- 구글드라이브연동
- 서버구글드라이브연동
- Prompt
- 파이썬 클래스 다형성
- Unsupervised learning
- prompt learning
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |