본문 바로가기

딥러닝/Semantic Segmentation

(5)
BiSeNet V2 : Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation 초록 Semantic segmentation을 위해서는 low-level detail과 high-level semantics가 중요하다. 그러나 빠른 속도를 위해 많은 방법론에서 low-level details를 희생시켰다. 이 논문에서는 그 대신 spatial detail과 categorical semantics를 따로따로 분리해서 취급한다. 구조 Detail Branch : wide channels와 shallow layers가 있어서 low-level details와 high-resolution feature representation captur Semantic Branch : narrow channels와 deep layers로 high-level semantic context 취득 Guided..
DeepLabv3+ 논문 리뷰 Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation 논문 (DeepLabv3+)를 리뷰해보려고 한다. 18년도에 나온 논문으로 3232회 인용되었다. 구조적으로 17년도에 발표된 DeepLabv3에 decoder 모듈을 더한 것이 특징이다. Semantic Segmentation을 하기 위해서는 두가지 방법이 있다. 1. Spatial pyramid pooling 모듈 사용 (multi-scale contextual 정보 추출 가능) 2. Encoder-decoder 구조 (점진적으로 공간 정보를 확장시키기 때문에 디테일한 경계 얻을 수 있음) 일반적으로 이미지가 DCNN을 거쳤을 때 마지막 피쳐맵에 풍부한 s..
(풀잎스쿨 14기) Deeplab v2 논문 리뷰 본 포스팅은 모두의연구소(home.modulabs.co.kr) 풀잎스쿨에서 진행된 'Semantic Segmentation 논문으로 입문하기' 과정 내용을 공유 및 정리한 자료입니다. Deeplab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs 논문 (Deeplabv2)을 리뷰해보려고 한다. 7167회 인용된 논문으로 14년도에 FCN, Deeplabv1가 나오고 15년도에 DilatedNet이 나온 이후 발표된 논문이다. Deeplabv1이 DCNN 부분에서 atrous convolution을 사용하고, CRF를 사용한 것에 집중했다면, Deeplabv2는 atro..
Unet 논문 리뷰 요즘은 Semantic Segmentation 관련 풀잎스쿨을 수강하고 있다. 이번 주차엔 SegNet, U-Net, U-Net++에 대해 공부해봤는데, U-Net은 일하면서도 쓸 일이 있어서 자세히 공부할 수 있었다. 일단 U-Net은 지난번에 포스팅한 DeconvNet과 마찬가지로 Semantic Segmentation을 위한 알고리즘이다. (대충 들어보면 Semantic Segmentation의 시초가 FCN, 큰 획을 그은 것이 U-Net, 요즘 대세가 Deeplab v3인 것 같다) 특징 1. 네트워크가 두 부분으로 구성됨 특징/맥락을 학습하는 contracting path 정확한 localization을 위한 expanding path 2. augmentation 활용 학습함 -. shift,..
Learning Deconvolution Network for Semantic Segmentation 논문 리뷰 이 논문은 2015년에 ICCV 학회에 발표된 논문이다. 성능이 크게 좋아지진 않았지만, FCN의 단점을 명확하게 짚고 이를 해결하기 위한 방법을 잘 설명해주었다. 초록 Deconvolution Network은 VGG16를 사용한 Convolution layer 위에 deconvolution, unpooling layer로 구성된 Deconvolution layer를 쌓은 구조이다. 이미지 내에서 추출한 proposal들을 네트워크에 넣어서 얻은 output들을 결합해서 최종적으로 segmentation map을 만들어 내는 형식으로 진행된다. FCN에서는 압축된 피쳐로부터 갑자기 큰 비율로 (32배, 16배, 8배) upsampling하여 인풋과 동일한 크기의 output을 얻었다. 그 결과 일부 정보..