InstructEval: Towards Holistic Evaluation of Instruction-Tuned Large Language Models 링크: https://arxiv.org/abs/2306.04757 11-12p A.3.1 Writing Evaluation Rubrics To evaluate the model outputs automatically, we use ChatGPT as an evaluator model. Specifically, we provide the generated output of a model and prompt the evaluator model to grade the generated text on a scale of 1 to 5 based on suitabl..
Title: JudgeLM: Fine-tuned Large Language Models are Scalable Judges 링크: https://arxiv.org/abs/2310.17631 여기서 만든 데이터셋 format으로 만들고, judgeLM으로 평가 내리는 것을 생각하기 (Github) Summary A novel approach to evaluating large language models, which are advanced AI models capable of generating human-like text. The main chanllenge in assessing LLMs is that existing benchmarks and metrics don't comprehensively me..
Title: Re3: Generating Longer Stories With Recursive Reprompting and Revision 링크: https://arxiv.org/abs/2210.06774 0 Abstract 2,000 단어가 넘는 긴 이야기를 자동으로 생성하는 문제를 고려한다. 짧은 이야기에 비해 긴 길이의 줄거리의 일관성과 관련성은 도전과제다. 이를 해결하기 위해 Recursive Reprompting and Revision (Re3) 프레임워크를 제안한다. 일반 목적의 언어 모델에게 구조적인 전반적 계획을 구성하도록 요청 계획과 현재 스토리 상태에서 얻은 맥락 정보를 언어 모델 프롬프트에 반복적으로 주입하여 스토리 구절 생성 줄거리의 일관성과 전제의 관롼셩을 위해 다른 시퀀스를 재순..
Title: A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications 링크: https://arxiv.org/abs/2402.07927 프롬프트 엔지니어링 구성 요소의 시각적 분석: 프롬프트를 형성하는 중추 요소인 광범위한 데이터, 지침 및 컨텍스트와 사용자 입력 인터페이스에 대해 교육받은 LLM이다. 대규모 언어 모델(Large Language Models, LLM) 및 시각-언어 모델(Vision-Language Model VLMs) 내의 프롬프트 엔지니어링 분야의 발전에 대한 개요 각 기술의 방법론, 응용, 관련 모델, 사용된 데이터셋에 대한 설명과 장점 및 한계 논의 2.1 New T..
python clip.py Traceback (most recent call last): File "clip.py", line 38, in clip_embeding = ClipEmbeding() File "clip.py", line 10, in __init__ self.model, self.processor = clip.load("/root/clip/model/ViT-B-32.pt", device=self.device) AttributeError: module 'clip' has no attribute 'load' 이런 에러가 나서 아래 명령어로 설치해주었다. pip install openai-clip
이것도 YOLOv5를 돌리다가 난 에러 RuntimeError: result type Float can't be cast to the desired output type long int 해당 에러를 보고 처음에, 이 에러가 난 코드를 계속 고쳤다. float 타입에서 long int 타입으로 캐스팅을 하려니까 발생한 오류라서, long() 호출 전 타입을 변경시키려고 총 5번 정도의 코드를 변경해서 시도했는데 모두 실패하였다. 결국 구글링을 해보니까 욜로를 쓰는 사람들에게서 나는 오류로 공통의 글이 쏟아졌다. 해결 방법은 https://github.com/ultralytics/yolov5/issues/8405 이 링크에 자세히 나오는데, 나는 docker build를 하지 않았기에 모델에 맞는 패키지 및..
YOLOv5를 돌려보는데, "cannot import name 'COMMON_SAFE_ASCII_CHARACTERS" 이런 에러가 떴다. ImportError: cannot import name 'COMMON_SAFE_ASCII_CHARACTERS' from 'charset_normalizer.constant' 욜로는 처음이라 엄청 낯선 에러명에 당황 중인데 생각보다 해결법은 단순했다! pip install chardet 해당 패키지를 설치해주면 끝! 범용 문자의 인코딩을 도와주는 코드라고 한다.
서버에 데이터셋을 다운 받는 방법으로는 wget을 사용하거나 curl 등이 있는데, 가끔 이 모든게 안 되는 데이터셋도 있다. 그래서 로컬에 다운 받고 서버로 옮겨야 하는데 무작정 파일 옮기듯이 끌어다 옮기면 잘 안 된다. 그래서 찾은 방법은 구글 드라이브에 업로드해서 구글 드라이브에서 바로 가져오는 것! 하지만 이마저도 데이터셋이 엄청 크다면 드라이브에 안 올라갈 수도 있으니 최대한 맞는 방법을 찾는 것이 좋은듯 하다. 1. 구글 드라이브에 먼저 파일을 올린다. 나는 2.39GB라는 이미지 데이터셋을 올렸고, 오른쪽 마우스를 클릭한 다음에 '공유 설정'을 클릭한다. 2. 공유 설정을 '링크가 있는 모든 사용자'로 변경한다. 그리고 링크를 복사한다. 예를 들어, 아무렇게나 친 링크이다. https://d..
- Total
- Today
- Yesterday
- CNN
- vscode 업데이트
- 프롬프트
- docker
- prompt learning
- 딥러닝
- 파이썬
- few-shot learning
- vscode 저장
- stylegan
- NLP
- clip
- 데이터셋다운로드
- cs231n
- python
- 구글드라이브서버연동
- 퓨샷러닝
- 도커
- vscode 종료
- 구글드라이브연동
- support set
- 서버에다운
- 구글드라이브다운
- 서버구글드라이브연동
- style transfer
- Prompt
- 구글드라이브서버다운
- Unsupervised learning
- vscode 자동 저장
- 도커 컨테이너
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |