[Deep Learning - CV] Beyond Classification ( Segmentation & Object Detection )

2022. 5. 13. 11:07AI/Codestates

728x90
반응형

분할 ( Segmentation ) 이란?

같은 의미를 가지는 부분을 구분해 내는 Task

출처 https://paperswithcode.com/task/semantic-segmentation

▶ Semantic Segmentation 

의미적으로 분류되는 개체에 대해서 동일하게 라벨링을 해줌

출처 https://nanonets.com/blog/semantic-image-segmentation-2020/

▶ Instance Segmentation

의미적으로 같더라도 다른 개체라면 다르게 라벨링을 해줌

출처 https://serengetitech.com/tech/deep-learning-instance-segmentation/

FCN ( Fully Convolutional Networks ) 란?

CNN에서 사용했던 완전 연결 신경망의 위치정보를 무시하기 때문에 Segmentation에 적용하기 적절하지 않는 점을 보와하기 위해 합성곱 층으로 모두 대체함

출처 https://paperswithcode.com/method/fcn

▶ UpSampling 

원래 이미지의 크기로 키우는 과정

▶ DownSampling 

이미지의 특징을 추출하는 과정

U-Net 이란?

출처 U-Net: Convolutional Networks for Biomedical Image Segmentation

▶ UpSampling

Convolution, Maxpooling

+ DownSampling 출력 Feature Map을 적당한 크기를 잘라서 붙여준 뒤 추가 데이터로 사용

▶ DownSampling

Convolution, Transpose Convolution

객체 탐지 / 인식 ( Object Detection / Recognition ) 이란?

전체 이미지에서 레이블에 맞는 객체를 찾아내는 Task

▶ IoU ( Intersection over Union ) 

객체 탐지를 평가하는 지표

▶ 2 - Stage Detector

일련의 알고리즘을 통해 객체가 있을 만한 곳을 추천받은 뒤에 추천받은 Region 즉 ROI ( Region of Interest ) 에 대해 분류하는 방식

→ R - CNN ( R - CNN, Fast R - CNN, Faster R - CNN ) 계열

▶ 1 - Stage Detector

추천 받지않고 입력 이미지를 작은 공간으로 나누어서 해당공간을 탐색하면 분류하는 방식

→ SSD 계열과 YOLO 계열 등

참고

U-Net: Convolutional Networks for Biomedical Image Segmentation

 

728x90
반응형