Meta learning, training 과정, bi-level optimization
논문 리뷰 발표를 위해 발등에 불떨어졌다. 주제는 메타러닝이기 때문에, 기본적인 개념을 빨리 팔로업하려고 한다.
Meta Learning
Meta-learning은 learning to learn으로 간략하게 설명합니다. 머신러닝 연구의 전통적 패러다임은 특정 task의 huge dataset으로 현재 dataset에 맞게끔 훈련시킵니다. 이 작업이 인간이 과거의 경험을 활용해서 단지 몇 가지 예에서 새로운 작업을 매우 빠르게 배우는 것과는 거리가 멀다고 생각했고, 인간은 배우는 법을 배우기 때문에 이런 아이디어에서 출발한 것 같습니다.
따라서 메타러닝의 아이디어는 learning the learning process입니다.
training 과정에서 배우는 것
- the initial parameters of the neural network
- the parameters of the optimizer
훈련 과정 자체를 따라 모델의 초기 가중치 및 옵티마이저의 매개변수로 역전파합니다. 그리고 이 두개의 중첩된 training process를 진행한다고 합니다.
Bi-Level Optimization
메타러닝의 프레임워크에서 bi-level optimization procedue는 아래와 같이 나눠집니다.
- inner optimization: 주어진 task에서 base learner가 학습하는 과정
- outer optimization: 여러 tasks에서 meta learner가 학습하는 과정
메타러닝의 데이터셋도 알고리즘을 찾기 위한 Source task와 찾은 알고리즘으로 새로운 task에 모델을 훈련 시키기 위한 Target task로 구분되어 있습니다.
MAML 방법이 optimization-based method에 속한다고 합니다. MAML은 Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks 해당 논문입니다.
Reference
[1] https://medium.com/huggingface/from-zero-to-research-an-introduction-to-meta-learning-8e16e677f78a
[2] https://wewinserv.tistory.com/138