올해 마지막 서두르세요! 현업 데이터 사이언티스트가 만든 유일한 과정 마감임박
#인공지능 

머신러닝? 나도 할 수 있을까? (머신러닝 기초 with 파이썬)

머신러닝 언젠가 해보고 싶었다면, 모두의연구소에서 만든 내일배움클래스 '머신러닝 기초 with 파이썬'을 들어 보세요!

2022-11-23 | 박주천

머신러닝? 나도 할 수 있을까?

어렵게만 생각하는 머신러닝 ‘나도 할 수 있을까?’ 라는 생각이 들었을 때

AI라면 진심인 모두의연구소에서 만든 내일배움클래스 강의 중 머신러닝 기초 with 파이썬을 통해

어느 교육회사 카피처럼 “야 너도 할 수 있어” 라는 답을 얻을 수 있을 것입니다. 🙂

 

머신러닝 기초 with 파이썬

강의를 간단하게 소개 하자면

이 강의는 파이썬 판다스 라이브러리부터 , 머신러닝에 대한 기본 내용까지 공부할 수 있는 가성비 높은 강의입니다. 실제 이 내용을 공부 해야 한다면 2~3권의 책을 사야 됩니다.

고용노동부에서 발급해주는 내일배움카드가 있다면 무료로 들을 수 있으니, 신청 하지 않으면 손해지 않을까요?

머신러닝 전 데이터 핸들링

10여년 동안 대학, 어학원, 많은 교육업체를 거치며 데이터분석가로 일해오면서 지금도 분석이 필요 할 때 꾸준하게 사용하는 라이브러리가 판다스 입니다.

이름도 ‘판다’  얼마나 귀여운가요 하하 🙂

그래서 판다스가 뭐냐고 물으신다면? 간단하게 소개 하는게 인지상정! 쉽게 엑셀 매크로와 비슷한 기능을 파이썬 언어로 사용하는 것 이라고 생각 하시면 됩니다.

행 열 추가, 빈 값 채우기, 자동 연산 등 코드 한 줄로 매일 반복하는 일들을 자동화 시킬 수 있는 강력한 라이브러리입니다. 파이썬을 몰랐다면 매일 야근 하고 있겠죠.(그렇다고 야근을 안하는 건….)

사용 방식은 보통

  1. 판다스를 import pandas라는 간단한 명령어로 불러오고
  2. 시리즈라는 하나의 열 데이터를  모은 데이터프레임을 만들고
  3. 인덱스, 컬럼명을 넣어주면 일단 어느 정도 쓸 수 있는 데이터 틀이 생깁니다.
  4. 필요에 따라 null값인 결측치를 처리하며, 간단하게 평균, 표준편차도 확인 할 수 있습니다.

이런 식으로 한번 코드를 작성해 놓으면 머신러닝에 필요한 데이터를 손쉽게 준비 할 수 있습니다.

이렇게 유용한 판다스 내용이 모두 160분이니 이것만 들어도 정말 충분합니다!

머신러닝

AI, 머신러닝, 딥러닝은

AI를 구현하는 방법 중에 하나가 머신러닝 이고 머신러닝 방법 중 더 깊은 단계가 딥러닝입니다.

머신러닝 속에 딥러닝이 있지만 일반적으로는 딥러닝 성능이 워낙 좋다 보니까 구분해서 이야기를 합니다.

머신러닝의 강의 구성은 총 470분으로 정말 가득 찬 강의입니다. 사실 이  정도 강의만 들어도 어디가서 자신있게 머신러닝에 대해 말하셔도 됩니다.

머신러닝에는 지도학습, 비지도학습로 나눌 수 있는데

지도학습은 미리 데이터를 학습 시키고 실제 데이터를 예측하는 것으로 데이터 특성에 따라 분류와 회귀로 나눌 수 있습니다.

지도학습(분류)

분류는 예를 들어 공부시간에 따른 합격 여부 , 고기 지방 함량에 따른 소고기 등급 등 말 그대로 데이터를 분류를 할 때 사용합니다. 결과는 가지치기를 하는 모양으로 우리가 볼 수 있으며, 내일배움클래스에서는 기본적으로 의사결정나무, 랜덤포레스트, xgboost를 배웁니다. 또, 잘 분류 되었는지 확인해 보는 교차검증으로 kfold, stratifiedkfold까지 배우게 됩니다. 여기서 배우는 모델들은 정말 기본이 되는 것임으로 확실하게 배우고 지나갈 수 있어 좋습니다.

지도학습(회귀)

회귀분석이라는 말이 생소 할 수 있겠지만 종속변수와 독립변수 사이의 관계를 분석하여 적합도를 측정해 내는 방법입니다. 쉽게 예를 들어, 시간(독립변수)에 따른 시험점수(종속변수) 등을 예측할 때 사용합니다. 결과는 보통 x,y축이 있는 이차원 그래프 형식으로 보입니다. 때로는 3차원 입체 그래프를 사용할 때도 있지만 많이 사용하지는 않습니다. 내일배움클래스에는 기본적으로 선형, 릿지, 라쏘, 엘라스틱넷, 랜덤포레스트, xgboost, 하이퍼파라미터 튜닝, 평가 까지 정말 다양한 모델들을 실습 할 수 있는 단단한 강의입니다.

비지도학습

비지도 학습은 종속변수가 없는 즉, 정답이 없는 데이터끼리 차이를 통해 군집을 형성 한다고 생각하시면 됩니다. 정확한 분류를 위해 차원을 축소하는 PCA 부터, 비계층적 군집분석을 위한 K-means , 계층적 군집분석을 위한 덴드로그램을 배웁니다. 비지도학습도 실무에서는 정말 많이 사용함으로 꼼꼼히 배우시는 것을 추천 드립니다. 쉽게 예를 들어 와인 특성에 따라 분류 하거나, 분꽃 종류 구별 등 실생활의 많은 영역에서 사용됩니다.

 

이미지 처리

 

후반에는 살짝 딥러닝 맛보기가 포함되어 있습니다. 특히 딥러닝에서는 CNN을 이용하여 실 생활에서 쉽게 접할 수 있는 의류 사진으로 이것이 티셔츠인지 신발인지, 가방인지 구분해 봅니다. 이 강의 이후 모두의연구소 김승일 소장님이 강의해 주시는 ‘쫄지말자 딥러닝’, ‘따라하자 딥러닝’을 추가로 들어 보시는 것을 추천 드립니다.

 

프로젝트

마지막 프로젝트로는 실제 airbnb데이터를 이용해, 데이터 전처리 부터 릿지, 라쏘, 랜덤포레스트 등 다양한 머신러닝 모델을 사용한 가격을 예측해 봅니다.

내일배움카드만 있다면 무료로 이렇게 알찬 강의를 듣고, 또 인생의 터닝포인트를 만들 수도 있는데 아직도 머뭇거리고 있다면 손해겠죠?? ㅎㅎ

처음은 어려울 수 있겠지만, 도전하지 않으면 기회도 생기지 않아요 ~ 😎