비전공자인데 어떻게 하면 머신러닝, 딥러닝을 잘 공부할 수 있을까? 라는 생각을 한번쯤 해보셨나요? 모든 학문이 그렇듯 머신러닝, 딥러닝을 공부할 때 모든 사람에게 권장할 수 있는 특별한 방법은 없습니다. 어떤 사람은 오프라인 수업이, 또다른 사람은 온라인 강의나 책이 더 집중이 잘 될 수 있어요. 학교에 가거나 실무를 통해 배우거나, 오픈 소스 소프트웨어 개발에 참여하면서 커리어를 쌓을 수도 있습니다.

어떤 방법이 다른 방법보다 항상 더 좋거나 더 빠르지 않습니다. 내가 모르는 보석같은 자료나 노하우가 어딘가에 있다고 생각하지 마세요. 시간을 들여 저마다의 속도로 하나씩 배우고 얻어 가는 방법밖에 없습니다. 다른 사람들도 모두 똑같은 과정을 거쳤거든요. 지금부터 『혼자 공부하는 머신러닝+딥러닝』 에는 어떤 내용이 담겨 있는지 톺아보겠습니다.

 

 

 

 

 

 

✅머신러닝 편(Ch 01 ~ 06)

Ch 01. 나의 첫 머신러닝에서는 머신러닝의 첫걸음을 떼며, 가장 기본적인 알고리즘인 k-최근접 이웃(KNN)을 만나봅니다. 비슷한 데이터를 기준으로 판단하는 이 알고리즘을 통해, 머신러닝이 어떻게 예측을 수행하는지 감을 잡을 수 있습니다. 간단한 원리로 작동하지만, 데이터 기반의 판단이 어떤 방식으로 이뤄지는지 직관적으로 이해할 수 있도록 도와줍니다.

 

머신러닝은 데이터를 어떻게 다루느냐에 따라 결과가 달라집니다. Ch 02. 데이터 다루기에서는지도 학습과 비지도 학습의 차이를 설명하고, 머신러닝 모델을 만들 때 데이터에 숨겨져 있는 문제점과 그 해결 방법을 다룹니다. 

 

 

 

 

Ch 03. 회귀 알고리즘과 모델 규제부터는 본격적으로 머신러닝 알고리즘의 구조를 파헤쳐 봅니다. k-최근접 이웃 회귀를 시작으로, 선형 회귀, 다항 회귀, 릿지, 라쏘 같은 다양한 회귀 알고리즘을 소개합니다. 이런 모델이 대표적인 회귀 모델입니다. 사이킷런에서 제공하는 대부분의 알고리즘이 분류와 회귀 양쪽 모두에 적용 가능하다는 점도 함께 짚고 넘어갑니다.

 

 

 

Ch 04. 다양한 분류 알고리즘에서는 로지스틱 회귀와 확률적 경사 하강법을 배웁니다. 이 알고리즘들은 딥러닝의 핵심 개념과도 밀접하게 연결되어 있어, 이후 신경망을 이해하는 데에도 큰 도움이 됩니다. 딥러닝을 학습하다가 잘 이해가 되지 않는다면 이 부분을 복습하시기 바랍니다.

 

 

 

Ch 05. 트리 알고리즘에서는 머신러닝에서 빼놓을 수 없는 결정 트리 알고리즘을 다룹니다. 머신러닝 분야에서 가장 높은 성능을 내는 앙상블 알고리즘은 주로 결정 트리(Decision Tree)를 기반으로 합니다. 사이킷런에 있는 여러 가지 앙상블 알고리즘 중에서도 특별히 인기가 높은 XGBoost와 LightGBM를 간단히 사용해 볼 예정입니다. 또 데이터를 효과적으로 사용하고 최적의 하이퍼파라미터를 찾기 위한 교차 검증과 그리드 서치를 소개합니다.

 

 

책에서는 자세히 다루지 않지만,  서포트 벡터 머신support vectormachine, SVM은 수학적으로 잘 정의되어 있고 널리 사용되는 알고리즘입니다. 관심 있는 분들은 별도의 참고 자료를 통해 학습해보시길 권합니다.

 

 

 

Ch 06. 비지도 학습에서는 타깃 데이터를 사용하지 않는 비지도 학습 알고리즘을 소개합니다. 먼저 군집에 대해 설명하고 대표적인 군집 알고리즘인 k-평균 알고리즘을 소개합니다. 하지만 이외에도 다른 군집 알고리즘이 많습니다. 대표적으로 병합 군집과 DBSCAN이 있습니다. 이어서 차원 축소의 대표적인 알고리즘인 PCA를 소개합니다. 역시 PCA 이외에도 더 많은 차원 축소 알고리즘이 있습니다.

 

 

 

 

 

✅딥러닝 편(Ch 04 ~ 10)

이제 딥러닝의 세계로 첫발을 내딛습니다. Ch 07. 딥러닝을 시작합니다에서는 딥러닝과 인공 신경망에 대해 소개합니다. 인공 신경망에는 새로운 용어와 개념이 많이 등장합니다. 용어가 낯설 수 있지만, 개념을 하나하나 정리하면서 이해할 수 있도록 구성했습니다. Ch 08과 Ch 09를 읽기 위해서는 Ch 07 꼭 이해하고 넘어가야 합니다.

 

 

 

이어지는 Ch 08. 이미지를 위한 인공 신경망Ch 09. 텍스트를 위한 인공 신경망은 딥러닝 분야에서 대표적 알고리즘인 합성곱 신경망과 순환 신경망을 소개합니다. 합성곱 신경망은 이미지 처리 분야에 뛰어난 성능을 발휘하고, 순환 신경망은 텍스트와 같은 순차 데이터 처리 분야에서 뛰어난 성능을 발휘합니다.

 

 

 

이 두 신경망은 각각 새로운 개념과 용어를 많이 사용하는데 이런 개념을 잘 이해하는 것이 중요합니다. 딥러닝 분야의 많은 모델이 이 두 신경망을 기반으로 만들어지기 때문입니다. 조금 더 흥미로운 딥러닝 알고리즘에 관심이 있다면 이미지 스타일을 변환하는 스타일 트랜스퍼나 새로운 이미지를 생성할 수 있는 GAN에 대한 자료를 추가적으로 살펴보시면 좋습니다.

 

마지막으로 Ch 10. 언어 모델을 위한 신경망에서는 텍스트 처리 분야에서 혁신적인 성과를 보여주고 있는 트랜스포머 알고리즘과 대규모 언어 모델(LLM)을 다룹니다. 트랜스포머 기반 모델은 크게 인코더 기반 모델, 인코더-디코더 모델, 디코더 기반 모델로 구분됩니다. 이러한 모델들은 방대한 데이터셋을 활용해 오랜 시간 동안 훈련됩니다. 다행히 오픈 소스로 공개된 LLM을 활용하면 직접 훈련하지 않아도 다양한 작업에 활용할 수 있습니다. Ch 10에서는 인코더-디코더 모델을 활용한 텍스트 요약과 디코더 기반 모델을 활용한 텍스트 생성하는 예제, 그리고 OpenAI의 API를 사용하는 방법도 함께 다룰 예정입니다.

 

지도 학습과 비지도 학습 외에 이 책에서 다루지 않은 세 번째 머신러닝 분야는 강화 학습reinforcement learning입니다. 강화 학습은 이세돌과 알파고의 대국으로 유명해졌죠. 특히 딥러닝과 강화 학습의 접목으로 이 분야는 어느 때보다도 놀라운 발전을 거듭하고 있습니다. 강화 학습에 관한 내용은 다른 도서를 함께 참고하셔도 좋습니다.

 

 

 

 

✅참고할 만한 사이트

박해선 저자의 블로그에는 무료로 읽을 수 있는 책의 일부를 공개해 놓았습니다. 여러 책의 동영상 강의에 대한 링크도 제공하고 있고 그 외 다양한 참고 자료를 담고 있습니다.  머신러닝과 딥러닝에 관한 문서를 번역하여 ml-ko.kr 사이트에서 제공합니다. 마음에 드는 내용을 찾아 마음껏 공부하세요.

• 저자의 블로그: https://tensorflow.blog
• 머신러닝 공식 문서 번역: https://ml-ko.kr
• 머신러닝&딥러닝 도서 로드맵: https://tensorflow.blog/book-roadmap/

 

 

✅커뮤니티

머신러닝과 딥러닝에 대해 관심 있는 사람들의 커뮤니티에 참여하면 많은 도움을 받을 수 있고 최신 정보를 얻기 좋습니다. 추천하는 커뮤니티는 다음과 같습니다.

• AGI 코리아: https://www.facebook.com/groups/TensorFlowKR
• 케라스 코리아: https://www.facebook.com/groups/KerasKorea
• 파이토치 한국 사용자 모임: https://pytorch.kr/
• 사이킷런 코리아: https://www.facebook.com/groups/ScikitLearnK

 

 

혼자 공부하는 머신러닝+딥러닝을 완독하면 머신러닝이 무엇인지, 딥러닝이 어떤 원리로 작동하는지 조금 이해할 수 있을 거예요. 그것만으로도 이 책의 가치는 충분합니다. 컴퓨터 과학 분야는 다른 어떤 분야보다도 개방적이고 공평합니다. 배울 수 있는 자료가 풍부하고 거의 모든 정보는 투명하게 공개되어 있습니다. 그중에서도 머신러닝 분야는 더욱더 그렇습니다.

공부하려는 의지만 있다면 여러분을 방해하는 것은 아무것도 없을 거예요. 이 책을 다 읽은 것에 그치지 말고 더 넓은 머신러닝 세계로 나가 보세요. 흥미진진한 이 분야에 들어온 것을 결코 후회하지 않을 것입니다. 아마도 훌륭한 많은 사람을 만나고 놀라운 기회를 얻을 수 있을 것입니다.

 


혼자 공부하는 머신러닝+딥러닝(개정판)

이번 개정판에서는 트랜스포머와 대규모 언어 모델(LLM) 실습을 새롭게 추가하고, 독자 요청이 많았던 파이토치 예제 코드를 보강해 케라스와 파이토치까지 익힐 수 있도록 학습의 폭을 넓혔습니다. 인공지능 분야는 점점 더 빠르게 발전하고 있습니다. 공부를 미루지 마세요. 이 책을 펼친 지금이 바로 공부하기 좋은 최적의 순간입니다! (۶•̀ᴗ•́)۶

👀 도서 자세히 보기
✍️ 유튜브 강의
📑 Q&A 바로가기