Cute Bunny 3 Deep-Dive AI
본문 바로가기 메뉴 바로가기

Deep-Dive AI

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

Deep-Dive AI

검색하기 폼
  • 분류 전체보기 (212)
    • AI (76)
      • Machine Learning (5)
      • Deep Learning (26)
      • Reinforcement Learing (2)
      • CS231n (11)
      • Computer Vision (19)
      • Linear Algebra (1)
      • NLP (9)
    • Review (19)
      • Paper (19)
    • Skills (116)
      • PyTorch (7)
      • Docker (14)
      • Pythons (20)
      • Git & Github (3)
      • DS & Algorithms (4)
      • Error (48)
      • etc (20)
    • Mine (1)
  • 방명록

전체 글 (212)
[PAPER] REALM: Retrieval-Augmented Language Model Pre-Training

https://arxiv.org/abs/2002.08909 REALM 논문은 구글이 발표한 논문으로 Language model에 Retrieval을 적용한 모델입니다. 기존의 언어 모델은 방대한 데이터로 사전 학습을 하더라도, 학습된 데이터 이외의 지식에 접근하지 못하는 한계가 있습니다. 이러한 모델은 학습 단계에서 제공된 정보에만 의존하여 knowledge를 parameter 내에서만 찾을 수 있습니다. 특히 오픈 도메인 질문 응답(Open-Domain QA)과 같은 과제에서는 사용자가 묻는 질문에 대한 답을 정확하게 제공하기 어려웠습니다.  최신 정보나 폭넓은 지식을 참고해야 하기 때문에 기존 언어 모델의 한계를 극복하고자 retrieval-augmented 언어 모델 학습을 하였습니다. 특징은 단순..

Review/Paper 2024. 9. 30. 20:52
VScode 터미널 출력 버퍼 늘리는 방법 → scrollback

Vsocde를 실행 시키면, 가끔 출력 라인이 많을 경우에 따로 로그를 저장해두지 않는다면 보고 싶었던 출력 결과를 못 볼 수가 있음 이럴 땐 출력되는 버퍼를 늘리는 방법이 존재 Setting > scrollback 검색  그 다음에 아래 기본 설정 되어 있는 1000을 원하는 만큼 바꾸면 됩니다.

Skills/etc 2024. 5. 25. 22:06
AttributeError: type object 'Callable' has no attribute '_abc_registry'

pip install fairscale 을 시도했는데, 정체불명의 빨간색, 노란색 에러가 올라가며 설치가 되지 않았다.  파이썬 버전 3.7과 충돌하는 무언가가 있는듯 하다. 설치하기 위한 어떤 속성이 없다는 에러 같았다. pip uninstall typing  이렇게 해보고, 안 되면 이 방법을 사용해보라고 한다. pip uninstall dataclasses.

Skills/Error 2024. 5. 25. 21:30
[논문 리뷰] InstructEval: Towards Holistic Evaluation of Instruction-Tuned Large Language Models

InstructEval: Towards Holistic Evaluation of Instruction-Tuned Large Language Models 링크: https://arxiv.org/abs/2306.04757 11-12p A.3.1 Writing Evaluation Rubrics To evaluate the model outputs automatically, we use ChatGPT as an evaluator model. Specifically, we provide the generated output of a model and prompt the evaluator model to grade the generated text on a scale of 1 to 5 based on suitabl..

Review/Paper 2024. 4. 20. 21:11
[논문 리뷰] JudgeLM: Fine-tuned Large Language Models are Scalable Judges

Title: JudgeLM: Fine-tuned Large Language Models are Scalable Judges 링크: https://arxiv.org/abs/2310.17631 여기서 만든 데이터셋 format으로 만들고, judgeLM으로 평가 내리는 것을 생각하기 (Github) Summary A novel approach to evaluating large language models, which are advanced AI models capable of generating human-like text. The main chanllenge in assessing LLMs is that existing benchmarks and metrics don't comprehensively me..

Review/Paper 2024. 4. 20. 21:09
[논문 리뷰] Re3: Generating Longer Stories With Recursive Reprompting and Revision

Title: Re3: Generating Longer Stories With Recursive Reprompting and Revision 링크: https://arxiv.org/abs/2210.06774 0 Abstract 2,000 단어가 넘는 긴 이야기를 자동으로 생성하는 문제를 고려한다. 짧은 이야기에 비해 긴 길이의 줄거리의 일관성과 관련성은 도전과제다. 이를 해결하기 위해 Recursive Reprompting and Revision (Re3) 프레임워크를 제안한다. 일반 목적의 언어 모델에게 구조적인 전반적 계획을 구성하도록 요청 계획과 현재 스토리 상태에서 얻은 맥락 정보를 언어 모델 프롬프트에 반복적으로 주입하여 스토리 구절 생성 줄거리의 일관성과 전제의 관롼셩을 위해 다른 시퀀스를 재순..

Review/Paper 2024. 4. 20. 21:07
[논문 리뷰] A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications

Title: A Systematic Survey of Prompt Engineering in Large Language Models: Techniques and Applications 링크: https://arxiv.org/abs/2402.07927 프롬프트 엔지니어링 구성 요소의 시각적 분석: 프롬프트를 형성하는 중추 요소인 광범위한 데이터, 지침 및 컨텍스트와 사용자 입력 인터페이스에 대해 교육받은 LLM이다. 대규모 언어 모델(Large Language Models, LLM) 및 시각-언어 모델(Vision-Language Model VLMs) 내의 프롬프트 엔지니어링 분야의 발전에 대한 개요 각 기술의 방법론, 응용, 관련 모델, 사용된 데이터셋에 대한 설명과 장점 및 한계 논의 2.1 New T..

Review/Paper 2024. 4. 20. 21:05
[Error] AttributeError: module 'clip' has no attribute 'load'

python clip.py Traceback (most recent call last): File "clip.py", line 38, in clip_embeding = ClipEmbeding() File "clip.py", line 10, in __init__ self.model, self.processor = clip.load("/root/clip/model/ViT-B-32.pt", device=self.device) AttributeError: module 'clip' has no attribute 'load' 이런 에러가 나서 아래 명령어로 설치해주었다. pip install openai-clip

Skills/Error 2024. 3. 3. 00:53
이전 1 2 3 4 5 ··· 27 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • NLP
  • 서버구글드라이브연동
  • 도커
  • 리눅스 나노
  • 리눅스
  • Prompt
  • 도커 작업
  • 도커 컨테이너
  • cs231n
  • 리눅스 nano
  • CNN
  • 퓨샷러닝
  • 파이썬 딕셔너리
  • support set
  • clip
  • 파이썬 클래스 계층 구조
  • Unsupervised learning
  • few-shot learning
  • stylegan
  • style transfer
  • linux nano
  • 리눅스 나노 사용
  • 파이썬 클래스 다형성
  • 구글드라이브연동
  • 딥러닝
  • python
  • 프롬프트
  • prompt learning
  • 파이썬
  • docker
more
«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
글 보관함
250x250

Blog is powered by Tistory / Designed by Tistory

티스토리툴바