Meta learning, training 과정, bi-level optimization

티스토리 뷰

AI/Deep Learning

Meta learning, training 과정, bi-level optimization

Suyeon Cha 2022. 11. 16. 10:46

728x90

논문 리뷰 발표를 위해 발등에 불떨어졌다. 주제는 메타러닝이기 때문에, 기본적인 개념을 빨리 팔로업하려고 한다.

Meta Learning

Meta-learning은 learning to learn으로 간략하게 설명합니다. 머신러닝 연구의 전통적 패러다임은 특정 task의 huge dataset으로 현재 dataset에 맞게끔 훈련시킵니다. 이 작업이 인간이 과거의 경험을 활용해서 단지 몇 가지 예에서 새로운 작업을 매우 빠르게 배우는 것과는 거리가 멀다고 생각했고, 인간은 배우는 법을 배우기 때문에 이런 아이디어에서 출발한 것 같습니다.

따라서 메타러닝의 아이디어는 learning the learning process입니다.

training 과정에서 배우는 것

the initial parameters of the neural network
the parameters of the optimizer

훈련 과정 자체를 따라 모델의 초기 가중치 및 옵티마이저의 매개변수로 역전파합니다. 그리고 이 두개의 중첩된 training process를 진행한다고 합니다.

Bi-Level Optimization

메타러닝의 프레임워크에서 bi-level optimization procedue는 아래와 같이 나눠집니다.

inner optimization: 주어진 task에서 base learner가 학습하는 과정
outer optimization: 여러 tasks에서 meta learner가 학습하는 과정

메타러닝의 데이터셋도 알고리즘을 찾기 위한 Source task와 찾은 알고리즘으로 새로운 task에 모델을 훈련 시키기 위한 Target task로 구분되어 있습니다.

MAML 방법이 optimization-based method에 속한다고 합니다. MAML은 Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks 해당 논문입니다.

Reference

[1] https://medium.com/huggingface/from-zero-to-research-an-introduction-to-meta-learning-8e16e677f78a

[2] https://wewinserv.tistory.com/138

728x90

저작자표시 비영리 변경금지 (새창열림)

'AI > Deep Learning' 카테고리의 다른 글

Few-shot learning 기본 개념(Basic concepts) (0)	2022.11.25
딥러닝 복습과 SENet 내용 복습 (0)	2022.11.20
Autoencoder란? - PyTorch로 구현하기 (0)	2022.11.08
C4W2L03-04 Resnets & Why ResNets Work (0)	2022.11.06
C4W2L07 Inception Network (0)	2022.11.06

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

글 보관함

250x250

Deep-Dive AI

티스토리 뷰

Meta learning, training 과정, bi-level optimization

Meta Learning

training 과정에서 배우는 것

Bi-Level Optimization

'AI > Deep Learning' 카테고리의 다른 글

티스토리툴바