Study Archives/Deep Learning

Deep Learning Fundamentals

ns4A 2026. 3. 9. 18:34

딥러닝을 처음 보면 용어부터 헷갈립니다.
AI, 머신러닝, 딥러닝이 비슷해 보이지만 사실 범위가 다릅니다. AI는 가장 큰 개념이고, 머신러닝은 데이터로부터 규칙을 학습하는 방식이며, 딥러닝은 그중에서도 여러 층의 신경망으로 복잡한 패턴을 학습하는 방법입니다. 즉, 딥러닝은 머신러닝의 한 종류이고, 머신러닝은 AI의 한 부분입니다.

딥러닝이 ‘deep’이라고 불리는 이유도 단순합니다.
은닉층이 여러 개 있는 신경망을 사용하기 때문입니다. 층이 깊어질수록 더 복잡한 패턴을 단계적으로 학습할 수 있다는 점이 핵심입니다.

 

딥러닝을 이해할 때 이미지 표현도 같이 알아두면 좋습니다.
이미지는 결국 픽셀의 집합입니다. RGB 이미지는 3개 채널로 색을 표현하고, grayscale 이미지는 1개 채널로 밝기만 표현합니다. 그래서 모델 입장에서는 이미지를 “예쁜 그림”이 아니라 숫자 배열로 받아들이게 됩니다.

흑백 이미지는 여기서 더 단순합니다.
색 정보 없이 각 픽셀의 강도만 저장하기 때문에 채널 수는 1입니다. 이 차이는 아주 기본적이지만, 나중에 입력 shape이나 모델 설계를 이해할 때 계속 중요하게 등장합니다.

 

이미지를 볼 때는 채널 수만이 아니라 공간 크기도 중요합니다.
가로와 세로 픽셀 수가 곧 이미지의 spatial dimension이 되고, 여기에 shape, size, structure 같은 형태 정보도 함께 고려됩니다. 결국 이미지 모델링은 색 정보와 공간 정보를 동시에 다루는 문제라고 볼 수 있습니다.

 

딥러닝 모델은 이런 이미지를 그대로 받아들이지 않습니다.
입력 데이터를 숫자 텐서로 보고, 여러 층을 거치며 특징을 추출한 뒤, 마지막에 예측값을 출력합니다. 정리하면 흐름은 간단합니다. 입력 데이터 → 신경망 레이어 → 출력입니다. 

여기서 중요한 점은 딥러닝이 단순히 정답만 외우는 방식이 아니라는 것입니다.
여러 층을 지나며 점점 더 복잡한 표현을 학습하고, 그 과정에서 사람이 직접 특징을 설계하지 않아도 계층적인 표현을 자동으로 만들어냅니다. 그래서 복잡한 이미지 문제나 비정형 데이터에서 특히 강점을 보입니다.

 

이 과정을 아이가 배우는 과정에 비유하기도 합니다.
처음에는 서툴지만, 반복해서 보면서 점점 더 잘 구분하게 되고, 틀린 부분은 줄여갑니다. 이 비유가 완전히 같은 것은 아니지만, 딥러닝의 학습 과정을 직관적으로 이해하는 데는 꽤 도움이 됩니다. 점점 정확도가 올라가고 손실이 줄어드는 흐름을 떠올리면 됩니다.

 

결국 딥러닝 입문에서 가장 먼저 잡아야 할 것은 세 가지입니다.
첫째, 딥러닝은 AI 안에 있는 다층 신경망 기반 학습이라는 점.
둘째, 이미지는 픽셀과 채널로 이루어진 숫자 데이터라는 점.
셋째, 모델은 입력을 받아 여러 층을 거치며 특징을 학습한 뒤 예측을 만든다는 점입니다.

이 세 가지만 먼저 잡아도, 이후 CNN이나 segmentation, detection 같은 주제로 넘어갈 때 훨씬 덜 헷갈리게 됩니다.

'Study Archives > Deep Learning' 카테고리의 다른 글

LangChain, RAG, Agent  (0) 2026.03.21
Vision Tasks and Layers  (0) 2026.03.09
RGB-D 데이터에서 Depth Estimation과 Semantic Segmentation 이해하기  (0) 2026.03.09
Data Augmentation  (0) 2023.11.18
Optimizer, Gradient descent  (0) 2023.11.17