엄범


https://github.com/sbrugman/deep-learning-papers

CNN 기반 DNN

VGG

구성이 간단해서 응용하기 좋다.

GoogLeNet

가로 방향에 폭이 있는 인셉션 구조.

ResNet

층이 매우 깊어서 gradient vanishing 문제를 해결하기 위해 스킵 연결을 도입한 것이 특징.

https://arxiv.org/abs/1512.03385


지도 학습 ( supervised learning )

사물 검출 ( Object Detection )

cs231n lecture 8

Faster R-CNN ( Regions with Convolutional Neural Network )

후보 영역을 추출하고, CNN으로 각 영역을 분류한다.

https://arxiv.org/abs/1506.01497


요즘은 YOLO나 SSD도 많이 거론된다.

https://telecombcn-dl.github.io/2017-dlcv/slides/D3L4-objects.pdf


Faster R-CNN은 Region Proposal Network가 존재하는 반면, YOLO와 SSD는 없다.

그래서 정확도는 더 낮지만 속도가 real-time에 사용해도 될 정도로 빠르다.


YOLO

https://pjreddie.com/darknet/yolo/

https://arxiv.org/abs/1612.08242

https://github.com/hizhangp/yolo_tensorflow


SDD

https://arxiv.org/abs/1512.02325


이미지 유사성 판별 ( Image Similarity )

Deep Ranking

이건 구식 알고리즘일 가능성이... 다른 알고리즘 한번 찾아봐야 함.

분할 ( Segmentation )

이미지를 픽셀 수준에서 분류(구분) 하는 것을 말한다. supervised learning의 한 종류.

* 이미지를 인식해서 영역별로 나눠주게 된다.

FCN ( Fully Convolutional Network )

FC layer를 없애고 이를 같은 기능을 하는 Conv layer로 처리했다.
따라서 마지막 출력까지 공간적 정보를 유지할 수 있다.

https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf


사진 캡션 생성

NIC ( Neural Image Caption )

NIC는 Deep CNN + RNN(Recurrent Neural Network)으로 구성된다.
이런 식으로 여러 종류의 정보를 조합하고 처리하는 것을 멀티모달(multimodal) 프로세싱이라고 한다.


화풍 변환

https://arxiv.org/abs/1508.06576