[PAPER] REALM: Retrieval-Augmented Language Model Pre-Training
https://arxiv.org/abs/2002.08909 REALM 논문은 구글이 발표한 논문으로 Language model에 Retrieval을 적용한 모델입니다. 기존의 언어 모델은 방대한 데이터로 사전 학습을 하더라도, 학습된 데이터 이외의 지식에 접근하지 못하는 한계가 있습니다. 이러한 모델은 학습 단계에서 제공된 정보에만 의존하여 knowledge를 parameter 내에서만 찾을 수 있습니다. 특히 오픈 도메인 질문 응답(Open-Domain QA)과 같은 과제에서는 사용자가 묻는 질문에 대한 답을 정확하게 제공하기 어려웠습니다. 최신 정보나 폭넓은 지식을 참고해야 하기 때문에 기존 언어 모델의 한계를 극복하고자 retrieval-augmented 언어 모델 학습을 하였습니다. 특징은 단순..
Review/Paper
2024. 9. 30. 20:52
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 구글드라이브서버다운
- Unsupervised learning
- style transfer
- NLP
- cs231n
- docker
- support set
- vscode 자동 저장
- few-shot learning
- 파이썬 클래스 계층 구조
- 구글드라이브다운
- Prompt
- 파이썬
- clip
- prompt learning
- 서버구글드라이브연동
- 파이썬 클래스 다형성
- 퓨샷러닝
- 구글드라이브서버연동
- 딥러닝
- 데이터셋다운로드
- 도커 컨테이너
- 구글드라이브연동
- stylegan
- 프롬프트
- 서버에다운
- CNN
- 도커
- python
- 파이썬 딕셔너리
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
글 보관함
250x250