인공지능은 사고나 학습 등 인간이 가진 능력을 컴퓨터를 통해 구현하는 기술입니다. 인공지능은 일반 컴퓨터의 처리 방식과는 다르게, 사람이 원하는 결과 데이터를 제공하면 인공지능이 알아서 처리 방법을 만들어 사람에게 처리 결과를 보여줍니다.

<컴퓨터가 처리하는 방식>

<인공지능이 처리하는 방식>

그리고 인공지능에는 머신러닝과 딥러닝이 있습니다. 머신러닝과 딥러닝의 가장 큰 차이점은 학습할 데이터에 있습니다. 머신러닝은 학습에 필요한 feature(특징)을 사람이 직접 제공해야 하지만, 딥러닝은 스스로 feature를 추출해서 데이터 학습에 적용할 수 있습니다. 조금 더 자세히 살펴볼까요?

🤖머신러닝(machine learning)

머신러닝은 컴퓨터가 학습할 수 있도록 하는 알고리즘(처리 방법)과 기술을 개발하는 분야로, 알고리즘을 이용해 데이터를 분석하고, 분석을 통해 학습하며, 학습한 내용을 기반으로 판단이나 예측을 합니다.

머신러닝은 학습 방법에 따라서 유형이 4가지로 구분됩니다.

1. 지도 학습(Supervised Learning)

정답이 있는 데이터를 활용해 데이터를 학습시키는 방법
종류: 분류(Classification), 회귀(Regression)

2. 비지도 학습(Unsupervised Learning)

정답이 없는 데이터를 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법
종류: 클러스터링, k-means

3. 준지도 학습(semi supervised)

지도 학습과 비지도 학습의 중간에 해당하는 기술로, 명확한 정답이 존재하나 정답이 있는 데이터를 구하기 힘들 때 사용

4. 강화 학습(Reinforcement Learning)

주어진 환경에서 어떤 행동을 취하고 이로부터 어떤 보상을 얻으면서 학습을 진행
개념: 에이전트, 환경, 상태, 행동, 보상

🤖딥러닝(Deep learning)

딥러닝은 머신러닝의 한 분야로, 뇌의 뉴런과 유사한 정보 입력층 계층을 활용해 데이터를 학습합니다. 딥러닝은 굉장한 양의 연산을 필요로 하기 때문에 하드웨어가 발달하지 않은 초기에는 어려웠지만 기술이 발달함에 따라 슈퍼컴퓨터를 기반으로 이러한 문제점을 해결했으며, 병렬 연산에 최적화된 GPU가 개발되면서부터 딥러닝 기술이 발전하게 되었습니다.

1. ANN(Artificial Neural Network)

위에서 설명한 머신러닝의 한 분야인 딥러닝은 인공신경망(Artificial Neural Network)를 기초로 하고 있는데요. 인공신경망이라고 불리는 ANN은 사람의 신경망 원리와 구조를 모방하여 만든 기계학습 알고리즘 입니다. 인간의 뇌에서 뉴런들이 어떤 신호, 자극 등을 받고, 그 자극이 어떠한 임계값을 넘어서면 결과 신호를 전달하는 과정에서 착안한 것입니다.

ANN은 입력 값을 이용하여 인공 뉴런의 출력 값을 계산하고, 인공 뉴런이 계산한 출력 값과 사용자가 기대하는 출력 값을 비교합니다. 이때 기대하는 출력 값을 생성할 수 있도록 가중치를 조절합니다. 그러나 ANN은 이러한 학습 과정에서 최적의 파라미터를 찾기 어렵고 학습 시간이 너무 느리다는 문제가 있습니다.

2. DNN(Deep Neural Network)
ANN기법의 여러 문제가 해결되면서 모델 내 은닉층을 많이 늘려서 학습의 결과를 향상시키는 방법이 등장하였고 이를 DNN(Deep Neural Network)라고 합니다. DNN은 은닉층을 2개 이상 지닌 학습 방법을 뜻합니다. 컴퓨터가 스스로 분류레이블을 만들어 내고 공간을 왜곡하고 데이터를 구분짓는 과정을 반복하여 최적의 구분선을 도출해냅니다. 많은 데이터와 반복학습이 필요하며 사전학습과 오류역전파 기법을 통해 현재 널리 사용되고 있습니다. 그리고 DNN을 응용한 알고리즘이 바로 CNN, RNN입니다. (이 외에도 LSTM, GRU 등이 있습니다.)

3. CNN(합성곱신경망 : Convolution Neural Network)
기존의 방식은 데이터에서 지식을 추출해 학습이 이루어졌지만, CNN은 데이터의 특징을 추출하여 특징들의 패턴을 파악하는 구조입니다. CNN은 사람의 시신경 구조를 모방한 것으로, 데이터를 feature로 추출하여 이 feature들의 패턴을 파악하는 구조입니다. feature 추출은 Convolution 과정과 Pooling 과정을 통해 진행됩니다. CNN은 Convolution Layer와 Pooling Layer를 복합적으로 구성하여 알고리즘을 만듭니다.

- Convolution: 데이터를 추출하는 과정으로 데이터에 각 성분의 인접 성분을 조사해 특징을 파악합니다. 여기서 도출된 특징을 추상화하여 특정 층으로 압축하며 이렇게 도출된 층을 Convolution Layer라고 부릅니다.
- Pooling: Convolution과정을 거친 Layer의 사이즈를 줄이는 과정입니다. 데이터 사이즈를 줄여 노이즈를 없애고 일괄적인 feature를 제공합니다. 보통 Convolution 과정에서 만들어진 feature의 가장 큰 값만 가져와 사이즈를 줄이는 데, 이것을 max pooling이라고 합니다..