deview 2023 day2 참석 후기
값비싼 Diffusion model을 받드는 저비용 MLOps - 김태훈 (Symbiote AI)
- 발표자료
- 예전부터
흠모팔로잉 하고 있던 carpedm20님의 발표… 연예인 보는 느낌이
Diffusion model이란 무엇인가? (기존 모델과의 차이?)
Diffusion model is [Multimodal, Image Generation model, with diffusion process]
결국 이미지 생성 모델인데, 다음과 같은 특징을 가진다.
- Multimodal 이란?
- Singlemodal은 이미지만 input으로 받는 모델
- Multimodal은 이미지 + 설명 text를 input으로 받는 모델
- diffusion process 란?
- GAN은 한 번에 최종 결과 image를 출력.
- 반면 Diffusion process는 noise 낀 중간 단계의 image를 출력하고, 다시 그 출력 image를 input으로 해서 noise를 제거하고… 이런 과정을 반복해서 최종 image까지 여러번 입출력을 돌리는 과정을 말함.
Diffusion Model의 단점 = 반복하므로 eval이 느리고, 리소스가 많이 들고, 학습이 느리다.
모델을 빠르게 해야 함. 해결 방향성 2가지. 모델다이어트와 스텝다이어트. (distillation. 증류 라는 단어를 쓴다.)
- 모델 다이어트? (Knowledge Distillation )
- 모델이 클 수록 느리고 비용이 크므로, 모델을 줄이자.
- 거대한 기존 모델을 Teacher Network로 두고, 상대적으로 작은 Student Network 구조를 짠 다음, 같은 input이 주어졌을 때 각 layer의 output이Teacher와같은 값을 내놓도록 Student를 학습시킨다.
- 스텝 다이어트? (Distillation of diffusion step )
- 스텝을 압축한 모델을 학습.a이미지를 넣었을 때 a10을 결과로 내도록 모델을 재학습하는 방식.
- 예를 들어 50번 반복하는 diffusion model이 있을 때, 새로운 Model의 1번 반복 결과가 기존 Model이 10번 반복한 결과와 동일한 결과를 내놓도록 새로운 모델을 학습시킨다. (=> 새로운 모델로는 5번만 반복해도 기존 Model이 50번 반복한 것과 같은 효과)
Symbiote AI의 엣지?
- AI에 대한 이해도
- 시장과 유저
This post is licensed under CC BY 4.0 by the author.