Deep Convolutional Neural Networks(AlexNet)를 사용한 ImageNet 분류 – 요약


이 기사에서 Alex Krizhevsky, Ilya Sutskever 및 Geoffrey E. Hinton의 2012년 논문
“심층 합성곱 신경망을 사용한 ImageNet 분류” (이하 AlexNet이라고 함).


  • 본 논문은 2012년 ILSVRC 대회에서 우승한 딥러닝 모델인 AlexNet을 소개하고 대규모 이미지 인식 작업을 위한 효율적인 모델 아키텍처를 제안한다.

  • AlexNet은 빠른 학습을 위해 ReLU, GPU 구현 등을 사용하는 8계층 신경망입니다.


    dropout을 이용하여 overfitting을 효과적으로 줄이는 것이 특징이다.

  • 이 논문의 공헌은 다음과 같다.

  1. ILSVRC-2012 대회에서 우수한 성능을 발휘했습니다.

  2. 고도로 최적화된 GPU로 구현 2차원 컨벌루션과 CNN의 구조공개했습니다.

  3. 신경망 성능을 개선하면서 훈련 시간을 줄이는 기술을 개발하십시오.
  4. 과적합 방지 기술을 소개합니다.

  5. AlexNet은 구조가 잘 짜여진 구조로 컨볼루션 레이어 중 하나를 제거해도 성능이 크게 저하됩니다.

  • 2012 ILSVRC 대회에서 Top-5 오류율 15.3%로 우승했습니다.

  • 고성능의 이유는 심층 CNN 구조와 데이터 확장, ReLU 및 Dropout과 같은 기술을 사용하기 때문입니다.

  • AlexNet은 CNN을 활용하여 딥 러닝 기술을 대중화합니다.

  • 이후 다양한 딥러닝 기반의 컴퓨터 비전 기법들이 제안되었다.