<인간의 경험 == 머신의 데이터>
- 지도 학습(Supervised Learning) : 학습 대상이 데이터에 정답을 주어 규칙성, 즉 데이터의 패턴을 배우게 하는 학습 방법
- 비지도 학습(Unsupervised Learning) : 정답이 없는 데이터 만으로 배우게 하는 학습 방법
- 강화 학습(Reinforcement Learning) : 선택한 결과에 대해 보상을 받아 행동을 개선하면서 배우게 하는 학습 방법
- 분류 문제(Classification) : 이미 적절히 분류된 데이터를 학습하여 분류 규칙을 찾고, 그 규칙을 기반으로 새롭게 주어진 데이터를 적절히 분류하는 것을 목적으로 함(지도학습)
- 회귀 문제(Regression) : 이미 결과값이 있는 데이터를 학습하여 입력 값과 결과 값의 연관성을 찾고, 그 연관성을 기반으로 새롭게 주어진 데이터에 대한 값을 예측하는 것을 목적으로 함(지도학습)
- 클러스터링(Clustering) : 주어진 데이터를 학습하여 적절한 분류 규칙을 찾아 데이터를 분류함을 목적으로 함. 정답이 없으니 성능을 평가 하기 어려움(비지도 학습)

모델링을 하기 전에 원하는 결과가 분류인지 회귀인지를 명확히 이해해야 한다.
얼핏 간단한 문제인 듯 하지만, 실수하는 경우가 매우 많다.
분류인지 회귀인지에 따라 사용할 알고리즘과 평가를 위한 함수가 달라지기 때문에 중요한 포인트다.
회귀는 연속적인 숫자를 예측하는 것이고 분류는 범주값을 예측한다고 할 수 있다.
예측해야 할 값이 연속성이 있는지 확인하면 분류와 회귀를 쉽게 구분할 수 있는데 나름의 팁으로는 그 값의 배수를 구했을 때 의미가 있는가로 판별 가능하다.
회귀 문제 | 분류 문제 |
• LinearRegression • KNeighborsRegressor • DecisionTreeRegressor • RandomForestRegressor • XGBRegressor • mean_absolute_error • mean_squared_error • root mean_squared_error • mean_absolute_percentage_error • r2_score |
•DecisionTreeClassifier •KNeighborsClassifier •LogisticRegression •RandomForestClassifier •XGBClassifier •accuracy_score •recall_score •precision_score •classification_report •confusion_matrix |
모델 : 데이터로부터 패턴을 찾아 수학식으로 정리해 놓은 것.
모델링이란 오차가 적은 모델을 만드는 과정.
머신이 적절한 학습을 통해 최선의 모델을 만들 수 있도록 노력하는 우리들의 행동을 모델링이라고 한다.
'AI' 카테고리의 다른 글
[Machine Learning] 기본 정리 (0) | 2023.10.12 |
---|---|
[Deep Learning] 딥러닝 히든레이어 (0) | 2023.09.05 |
[Deep Learning] 아이리스 품종 분류, 원핫인코딩, 활성화함수 (0) | 2023.09.05 |
[Deep Learning] 딥러닝 보스턴 집값 예측, 퍼셉트론 (0) | 2023.09.04 |
[Deep Learning] 딥러닝 Tensorflow 기본, loss (0) | 2023.09.04 |
댓글