Post

CNN model과 다양한 분야에 딥러닝을 적용한 논문들

https://github.com/sbrugman/deep-learning-papers

CNN 기반 DNN

VGG

구성이 간단해서 응용하기 좋다. https://arxiv.org/abs/1409.1556

GoogLeNet

가로 방향에 폭이 있는 인셉션 구조. https://arxiv.org/abs/1409.4842

ResNet

층이 매우 깊어서 gradient vanishing 문제를 해결하기 위해 스킵 연결을 도입한 것이 특징.

https://arxiv.org/abs/1512.03385

지도 학습 ( supervised learning )

사물 검출 ( Object Detection )

cs231n lecture 8

Faster R-CNN ( Regions with Convolutional Neural Network )

후보 영역을 추출하고, CNN으로 각 영역을 분류한다.

https://arxiv.org/abs/1506.01497

요즘은 YOLO나 SSD도 많이 거론된다.

https://telecombcn-dl.github.io/2017-dlcv/slides/D3L4-objects.pdf

Faster R-CNN은 Region Proposal Network가 존재하는 반면, YOLO와 SSD는 없다. 그래서 정확도는 더 낮지만 속도가 real-time에 사용해도 될 정도로 빠르다.

YOLO

https://pjreddie.com/darknet/yolo/

https://arxiv.org/abs/1612.08242

https://github.com/hizhangp/yolo_tensorflow

SDD

https://arxiv.org/abs/1512.02325

이미지 유사성 판별 ( Image Similarity )

Deep Ranking

이건 구식 알고리즘일 가능성이… 다른 알고리즘 한번 찾아봐야 함. http://arxiv.org/abs/1506.01497

분할 ( Segmentation )

이미지를 픽셀 수준에서 분류( 구분 ) 하는 것을 말한다. supervised learning의 한 종류. * 이미지를 인식해서 영역별로 나눠주게 된다.

FCN ( Fully Convolutional Network )

FC layer를 없애고 이를 같은 기능을 하는 Conv layer로 처리했다. 따라서 마지막 출력까지 공간적 정보를 유지할 수 있다.

https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf

사진 캡션 생성

NIC ( Neural Image Caption )

NIC는 Deep CNN + RNN(Recurrent Neural Network)으로 구성된다. 이런 식으로 여러 종류의 정보를 조합하고 처리하는 것을 멀티모달(multimodal) 프로세싱이라고 한다. https://arxiv.org/abs/1411.4555

화풍 변환

https://arxiv.org/abs/1508.06576

This post is licensed under CC BY 4.0 by the author.