GDSC SungShin Women's University 23-24/Story

[Winter Blog Challenge] CNN 모델 설명 & 종류(Member 신하령)

GDSC SungShin Team 2024. 2. 13. 16:22

안녕하세요! GDSC Sungshin University Member 신하령입니다.

오늘은 평소 제가 관심 있었던 딥러닝 CNN모델에 대한 간단한 설명과 종류에 대해서 설명해드리도록 하겠습니다!

1. CNN 개요

Convolutional Neural Networks의 약자로 합성곱 신경망이라고 불리는 딥러닝 모델입니다. 이미지 인식 분야에서 뛰어난 성능을 발휘하며, 자연어 처리, 음성 인식 등 다양한 분야에서도 활용됩니다.

2. CNN 특징

  • 인간의 시신경 구조를 모방한 기술
  • 특징맵을 생성하는 필터까지도 학습이 가능해 비전(vision) 분야에서 성능이 우수
  • 이미지를 인식하기 위해 패턴을 찾는데 특히 유용
  • 데이터를 직접 학습하고 패턴을 사용해 이미지를 분류
  • 이미지의 공간 정보를 유지한 채 학습을 하는 모델
  • 사람이 여러 데이터를 보고 기억한 후 무엇인 지 맞추는 것과 유사

3. CNN 모델 구성 요소

  • 합성곱 레이어: 이미지에 필터를 적용하여 특징 맵을 생성
  • 풀링 레이어: 이미지 크기를 줄여 계산 효율성을 높이고 과적합을 방지
  • 완전 연결 레이어: 최종 분류 또는 회귀 수행

이미지의 특징을 추출하는 부분과 클래스를 분류하는 부분으로 나눌 수 있는데, 특징 추출 영역은 합성곱 레이어와 풀링 레이어를 여러 겹 쌓는 형태로 구성됩니다. 합성곱 레이어는 입력 데이터에 필터를 적용한 후 활성화 함수를 반영하는 필수 요소이고, 풀링 레이어는 선택적 레이어입니다.

마지막 부분에 이미지 분류를 위한 완전 연결 레이어가 추가되는데, 이미지의 특징을 추출하는 부분과 이미지를 분류하는 부분 사이에 이미지 형태의 데이터를 배열 형태로 만드는 Flatten 레이어가 위치하게 됩니다.

4. CNN 모델의 장점과 단점

장점

  • 이미지 인식 분야에서 뛰어난 성능
  • 공간 정보 유지
  • 계산 효율성
  • 과적합 방지

단점

  • 학습 데이터가 많이 필요
  • 모델 학습 및 추론 속도 느림
  • 하이퍼 파라미터 조정 어려움

5. CNN 모델 종류

1. LeNet - 5

LeNet - 5 는 LeNet 모델 중 가장 최근 모델이며 Yann LeCun 연구실에서 1990년대에 만들어졌습니다. 우편번호나 숫자를 인식하는데 활용되었습니다. LeNet구조가 지금의 CNN과 큰 다른 점이 없다는 것이 핵심입니다. Convolution과 subsampling이 쓰이고 feature map을 일자로 펼치는 fully-connection으로 연결 했습니다.

 

2. AlexNet

AlexNet은 ILSVRC 2012 에서 우승한 모델이고, 이 때 당시 AlexNet 모델에 인해 딥러닝에 혁명이 일었다고 볼 수 있습니다. 왜냐하면 AlexNet이 CNN 구조로 과거의 top 5 error를 크게 줄였기 때문입니다. 그 이후로 image neural network에서 CNN기법을 사용하기 시작했습니다. 활성화 함수로는 ReLU함수를 적용했습니다.

 

3. VGGNet

VGGNet은 ILSVRC 2014에서 2등을 한 모델입니다. VGGNet은 CNN가 depth가 깊어지면 성능이 더 좋아진다는 것을 보여준 모델입니다. VGGNet의 경우 AlexNet에 비해서 Conv layer가 굉장히 많습니다. VGGNet의 경우 단순한 구조(3x3)의 모형을 깊게 쌓았지만 error가 크게 줄어들었다고 합니다.

 

4. GoogLeNet

22 레이어를 가졌으며 인셉션 모듈을 채택하였습니다. 2014년 ILSVRC에서 1위를 한 모델입니다. GoogLeNet과 AlexNet을 비교해보면 GoogLeNet이 depth가 더 깊기도 하고 width도 더 두꺼운데, parameter의 개수를 보면 어마어마하게 줄었다는 것을 볼 수 있습니다. GoogLeNet을 보면 Network 구조 안에 Network 처럼 생긴 Layer가 존재한다. 이런 구조를 Network In Network(NIN) 구조라고 지칭합니다.

 

5. ResNet

ResNet 모델은 ILSVRC 2015에서 우승한 모델입니다. Deep residual network입니다. 152개의 레이어를 가졌으며 총 5개의 이미지 분류 대회에서 1위를 차지했습니다. 다양한 대회에서 한 개의 모델로 순위를 쟁취했다는 것은, 굉장히 범용성 있고, 좋은 모델임을 의미합니다.

 

마무리 말

3학년 때 심층학습이라는 강의를 통해 cnn모델에 대해 많은 관심이 생겼습니다.

이번 솔루션 챌린지를 진행하면서 cnn 모델을 직접 구현할 기회가 생겼는데, 이론적으로도 그렇고 많은 부분에서 아직 많이 부족하다는 것을 느껴서 더 공부해 보고 싶다는 생각이 들었습니다.

남은 방학 기간 동안 더 열심히 공부하고 실습도 해봐야겠다고 생각했습니다!

모두 방학 잘 보내시고 솔루션 챌린지도 화이팅 하세요~!

오늘은 평소 제가 관심 있었던 딥러닝 CNN모델에 대한 간단한 설명과 종류에 대해서 설명해드리도록 하겠습니다!

 

참고

[딥러닝 모델] CNN (Convolutional Neural Network) 설명

 

[딥러닝 모델] CNN (Convolutional Neural Network) 설명

저번 포스팅에서는 딥러닝의 모델별 특징에 대해 알아보았습니다. 2021.07.10 - [SW programming/Computer Vision] - AI, 머신러닝, 딥러닝 이란? 그리고 딥러닝 모델 종류 그리고 이번 포스팅에서는 그 중 Compu

rubber-tree.tistory.com

[CS231N] CNN 기반 모델의 종류(LeNet, AlexNet, ZFNet, VVGNet, GoogleNet, ResNet, DenseNet)

 

[CS231N] CNN 기반 모델의 종류(LeNet, AlexNet, ZFNet, VVGNet, GoogleNet, ResNet, DenseNet)

Contents ImageNet에서 유명한 CNN model 을 설명하는 파트다. LeNet - 5 LeNet - 5 는 LeNet 모델 중 가장 최근 모델이며 Yann LeCun 연구실에서 1990년대에 만들어졌다. 우편번호나 숫자를 인식하는데 활용되었다.

ok-lab.tistory.com

4가지 CNN 살펴보기: AlexNet, VGG, GoogLeNet, ResNet

 

4가지 CNN 살펴보기: AlexNet, VGG, GoogLeNet, ResNet

핵심 키워드 CNN(Convolutional Neural Network) Conv2D AlexNet VGG GoogLeNET ResNet 학습하기 오늘 살펴볼 CNN 아키텍쳐는 총 4가지 입니다. AlexNet, VGG, GoogLeNet, ResNet. 일반적으로 유명한 CNN 아키텍쳐로 이 4개를 꼽

junklee.tistory.com