티스토리 뷰

728x90

논문 리뷰 발표를 위해 발등에 불떨어졌다. 주제는 메타러닝이기 때문에, 기본적인 개념을 빨리 팔로업하려고 한다.

 

Meta Learning

Meta-learning은 learning to learn으로 간략하게 설명합니다. 머신러닝 연구의 전통적 패러다임은 특정 task의 huge dataset으로 현재 dataset에 맞게끔 훈련시킵니다. 이 작업이 인간이 과거의 경험을 활용해서 단지 몇 가지 예에서 새로운 작업을 매우 빠르게 배우는 것과는 거리가 멀다고 생각했고, 인간은 배우는 법을 배우기 때문에 이런 아이디어에서 출발한 것 같습니다.

따라서 메타러닝의 아이디어는 learning the learning process입니다.

 

training 과정에서 배우는 것

  • the initial parameters of the neural network
  • the parameters of the optimizer

 

훈련 과정 자체를 따라 모델의 초기 가중치 및 옵티마이저의 매개변수로 역전파합니다. 그리고 이 두개의 중첩된 training process를 진행한다고 합니다.

 

원래 학습 과정

 

메타러닝 학습 과정

 

 

Bi-Level Optimization

메타러닝의 프레임워크에서 bi-level optimization procedue는 아래와 같이 나눠집니다.

 

  1. inner optimization: 주어진 task에서 base learner가 학습하는 과정
  2. outer optimization: 여러 tasks에서 meta learner가 학습하는 과정

 

메타러닝의 데이터셋도 알고리즘을 찾기 위한 Source task와 찾은 알고리즘으로 새로운 task에 모델을 훈련 시키기 위한 Target task로 구분되어 있습니다. 

 

MAML 방법이 optimization-based method에 속한다고 합니다. MAML은 Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks 해당 논문입니다.

 

 

Reference

[1] https://medium.com/huggingface/from-zero-to-research-an-introduction-to-meta-learning-8e16e677f78a

[2] https://wewinserv.tistory.com/138

 

728x90
댓글