CNN model과 다양한 분야에 딥러닝을 적용한 논문들
https://github.com/sbrugman/deep-learning-papers
CNN 기반 DNN
VGG
구성이 간단해서 응용하기 좋다. https://arxiv.org/abs/1409.1556
GoogLeNet
가로 방향에 폭이 있는 인셉션 구조. https://arxiv.org/abs/1409.4842
ResNet
층이 매우 깊어서 gradient vanishing 문제를 해결하기 위해 스킵 연결을 도입한 것이 특징.
https://arxiv.org/abs/1512.03385
지도 학습 ( supervised learning )
사물 검출 ( Object Detection )
cs231n lecture 8
Faster R-CNN ( Regions with Convolutional Neural Network )
후보 영역을 추출하고, CNN으로 각 영역을 분류한다.
https://arxiv.org/abs/1506.01497
요즘은 YOLO나 SSD도 많이 거론된다.
https://telecombcn-dl.github.io/2017-dlcv/slides/D3L4-objects.pdf
Faster R-CNN은 Region Proposal Network가 존재하는 반면, YOLO와 SSD는 없다. 그래서 정확도는 더 낮지만 속도가 real-time에 사용해도 될 정도로 빠르다.
YOLO
https://pjreddie.com/darknet/yolo/
https://arxiv.org/abs/1612.08242
https://github.com/hizhangp/yolo_tensorflow
SDD
https://arxiv.org/abs/1512.02325
이미지 유사성 판별 ( Image Similarity )
Deep Ranking
이건 구식 알고리즘일 가능성이… 다른 알고리즘 한번 찾아봐야 함. http://arxiv.org/abs/1506.01497
분할 ( Segmentation )
이미지를 픽셀 수준에서 분류( 구분 ) 하는 것을 말한다. supervised learning의 한 종류. * 이미지를 인식해서 영역별로 나눠주게 된다.
FCN ( Fully Convolutional Network )
FC layer를 없애고 이를 같은 기능을 하는 Conv layer로 처리했다. 따라서 마지막 출력까지 공간적 정보를 유지할 수 있다.
https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf
사진 캡션 생성
NIC ( Neural Image Caption )
NIC는 Deep CNN + RNN(Recurrent Neural Network)으로 구성된다. 이런 식으로 여러 종류의 정보를 조합하고 처리하는 것을 멀티모달(multimodal) 프로세싱이라고 한다. https://arxiv.org/abs/1411.4555