본문 바로가기

전체 글

(43)
BiSeNet V2 : Bilateral Network with Guided Aggregation for Real-time Semantic Segmentation 초록 Semantic segmentation을 위해서는 low-level detail과 high-level semantics가 중요하다. 그러나 빠른 속도를 위해 많은 방법론에서 low-level details를 희생시켰다. 이 논문에서는 그 대신 spatial detail과 categorical semantics를 따로따로 분리해서 취급한다. 구조 Detail Branch : wide channels와 shallow layers가 있어서 low-level details와 high-resolution feature representation captur Semantic Branch : narrow channels와 deep layers로 high-level semantic context 취득 Guided..
오프라인 환경에서 파이썬 패키지들 설치하기 내 PC에 pip install 패키지명 로 설치한 패키지들을 인터넷이 되지 않는 PC에 설치하고 싶을 때!! 1. "pip freeze > req.txt"로 내가 설치하려고 하는 패키지 목록을 txt 파일에 저장한다. - 패키지명과 필요로하는 version이 적힘 - 얘네들을 설치할거야!! 라는게 써있는 파일 2. "pip download 패키지명"으로 whl 파일을 다운로드 받는다. - 우리 회사의 경우 보안프로그림 때문에 pip install 했을 때처럼 --trusted-host pypi.org --trusted-host files.pythonhosted.org --trusted-host download.pytorch.org를 붙여줘야했다. - 실질적인 설치 파일들 다운로드 3. "pip inst..
글또 5기 마지막 회고록 벌써 장장 6개월에 걸친 글또 5기 마지막 글을 작성하게 됐습니다. 처음엔 엄청난 열정으로 시작했었는데, 생각보다 글을 쓴다는 것이 너무 어렵다는 것을 느낄 수 있었습니다. 그래도 다른 분들과도 약속했다는 생각에 글또를 시작하고 16개의 글을 작성하는 쾌거(?)를 거뒀습니다. 글또와 함께 풀잎스쿨도 함께 수강했었는데, 이를 알고만 있는 것보다 글로 정리해서 작성하는 것이 스스로에게 큰 도움이 된다는 것도 느낄 수 있었습니다. 전반적으로 성실하게 사는데에 도움이 됐던 글또 활동이었지만, 아쉬운 점도 있었습니다. 1. 패스권을 3회까지 쓸 수 있었는데, 3회를 모두 다 작성한 점 2. 글또와 함께 풀잎스쿨도 참여했었는데, 매주 학습한 것을 모두 올리지 않은 점 3. 코로나때문에 글또를 함께하는 사람들과 직접..
DeepLabv3+ 논문 리뷰 Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation 논문 (DeepLabv3+)를 리뷰해보려고 한다. 18년도에 나온 논문으로 3232회 인용되었다. 구조적으로 17년도에 발표된 DeepLabv3에 decoder 모듈을 더한 것이 특징이다. Semantic Segmentation을 하기 위해서는 두가지 방법이 있다. 1. Spatial pyramid pooling 모듈 사용 (multi-scale contextual 정보 추출 가능) 2. Encoder-decoder 구조 (점진적으로 공간 정보를 확장시키기 때문에 디테일한 경계 얻을 수 있음) 일반적으로 이미지가 DCNN을 거쳤을 때 마지막 피쳐맵에 풍부한 s..
(풀잎스쿨 14기) Deeplab v2 논문 리뷰 본 포스팅은 모두의연구소(home.modulabs.co.kr) 풀잎스쿨에서 진행된 'Semantic Segmentation 논문으로 입문하기' 과정 내용을 공유 및 정리한 자료입니다. Deeplab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs 논문 (Deeplabv2)을 리뷰해보려고 한다. 7167회 인용된 논문으로 14년도에 FCN, Deeplabv1가 나오고 15년도에 DilatedNet이 나온 이후 발표된 논문이다. Deeplabv1이 DCNN 부분에서 atrous convolution을 사용하고, CRF를 사용한 것에 집중했다면, Deeplabv2는 atro..
Unet 논문 리뷰 요즘은 Semantic Segmentation 관련 풀잎스쿨을 수강하고 있다. 이번 주차엔 SegNet, U-Net, U-Net++에 대해 공부해봤는데, U-Net은 일하면서도 쓸 일이 있어서 자세히 공부할 수 있었다. 일단 U-Net은 지난번에 포스팅한 DeconvNet과 마찬가지로 Semantic Segmentation을 위한 알고리즘이다. (대충 들어보면 Semantic Segmentation의 시초가 FCN, 큰 획을 그은 것이 U-Net, 요즘 대세가 Deeplab v3인 것 같다) 특징 1. 네트워크가 두 부분으로 구성됨 특징/맥락을 학습하는 contracting path 정확한 localization을 위한 expanding path 2. augmentation 활용 학습함 -. shift,..
Learning Deconvolution Network for Semantic Segmentation 논문 리뷰 이 논문은 2015년에 ICCV 학회에 발표된 논문이다. 성능이 크게 좋아지진 않았지만, FCN의 단점을 명확하게 짚고 이를 해결하기 위한 방법을 잘 설명해주었다. 초록 Deconvolution Network은 VGG16를 사용한 Convolution layer 위에 deconvolution, unpooling layer로 구성된 Deconvolution layer를 쌓은 구조이다. 이미지 내에서 추출한 proposal들을 네트워크에 넣어서 얻은 output들을 결합해서 최종적으로 segmentation map을 만들어 내는 형식으로 진행된다. FCN에서는 압축된 피쳐로부터 갑자기 큰 비율로 (32배, 16배, 8배) upsampling하여 인풋과 동일한 크기의 output을 얻었다. 그 결과 일부 정보..
Continual Learning (2) Deep Generative Replay 논문 번역 이 글은 Continual Learning을 위한 방법 중 첫 번째로 메모리를 활용한 Deep Generative Replay 구조를 설명한 논문을 번역한 글입니다. 이는 우리의 뇌에서 영감을 받아 generator, solver의 두 네트워크로 구성된 모델(scholar)를 학습시키는 프레임워크입니다. 이 논문의 가장 큰 특징은 generator 네트워크를 사용해서 이전 tasks에서 학습한 분포를 기반으로 데이터를 생성시킬 수 있다는 것입니다. 이렇게 생성한 데이터와 함께 새로운 task에 대한 실제 데이터를 모델에 넣어줌으로써 새로운 task를 학습하더라도 이전 tasks에 대한 성능을 유지할 수 있게 됩니다. (번역하는 과정에서 이해가 가지 않는 말이나 매끄럽지 못한 문장들도 있는데 양해 부탁드립..