본문 바로가기

AI6

[Machine Learning] 기본 정리 평균과 오차 통계학에서 사용되는 가장 단순한 모델 중 하나가 평균이다. 즉 우리가 평소에 익숙하게 사용해왔던 '평균'도 하나의 모델이었던 것이다. 관측값(실제값)과 모델의 예측값의 차이를 이탈도(Deviance), 오차 라고 한다. 과대적합, 과소적합 과대적합 (Overfitting) - 학습 데이터에 대해서는 성능이 매우 좋은데, 평가 데이터에 대해서는 성능이 좋지 않은 경우 - 학습 데이터에 대해서만 잘 맞는 모델. 실전에서 예측 성능이 좋지 않음. - 보통 과적합이라고 하면 과대적합을 의미한다. 과소적합 (Underfitting) - 학습 데이터보다 평가 데이터에 대한 성능이 매우 좋거나, 모든 데이터에 대한 성능이 매우 안 좋은 경우 - 모델이 너무 단순하여 학습 데이터에 대해 적절히 훈련이 되지.. 2023. 10. 12.
[Machine Learning] Machine Learning 지도 학습(Supervised Learning) : 학습 대상이 데이터에 정답을 주어 규칙성, 즉 데이터의 패턴을 배우게 하는 학습 방법 비지도 학습(Unsupervised Learning) : 정답이 없는 데이터 만으로 배우게 하는 학습 방법 강화 학습(Reinforcement Learning) : 선택한 결과에 대해 보상을 받아 행동을 개선하면서 배우게 하는 학습 방법 분류 문제(Classification) : 이미 적절히 분류된 데이터를 학습하여 분류 규칙을 찾고, 그 규칙을 기반으로 새롭게 주어진 데이터를 적절히 분류하는 것을 목적으로 함(지도학습) 회귀 문제(Regression) : 이미 결과값이 있는 데이터를 학습하여 입력 값과 결과 값의 연관성을 찾고, 그 연관성을 기반으로 새롭게 주어진 데.. 2023. 10. 11.
[Deep Learning] 딥러닝 히든레이어 왼쪽만 보았을 때, 13개의 입력을 받고 5개의 출력을 만드는 모델이라고 볼 수 있다. (다섯개의 수식이 필요할 것이다) 오른쪽 박스만 보았을 때, 다섯개의 입력을 받고 하나의 출력을 만드는 모델일 것이다.(한개의 수식) 각각의 모델을 연속적을 연결하여 하나의 거대한 신경망을 만드는 것이 딥러닝 인공신경망이다. 망을 깊게 쌓는 것이다 ! 딥러닝이 찾은 새로운 5개의 특징. 이 특징이 어떤건지는 사람은 설명 못한다. 딥러닝이 찾은거다. 딥러닝이 스스로 다섯개의 유의미한 특징을 만들어서 최종결과를 만들었다고 말할 수 있다. 딥러닝 -> 특징 자동 추출기 import tensorflow as tf import pandas as pd # 데이터 준비 보스턴 = pd.read_csv('boston.csv') 보스.. 2023. 9. 5.
[Deep Learning] 아이리스 품종 분류, 원핫인코딩, 활성화함수 양적(숫자형) -> 숫자형 범주형 -> 분류형 기계적으로 외워져버린 판별법이다. 대신 변수가 숫자형인지 범주형인지는 잘 파악할 것. 종속변수의 값이 범주형일 때는 어떻게 할까? 숫자가 아닌 것이 수식의 결과로 나올 수는 없을 것이다. 수식에서는 입력이든 출력이든 숫자만 들어갈 수 있다. 범주형 데이터를 수식에 사용할 수 있도록 바꾸어 주어야한다. 범주형 데이터를 0과 1로 바꾸어주는 과정을 '원핫인코딩(onehot-encoding)' 이라고 한다. import pandas as pd import tensorflow as tf # 데이터 준비 아이리스 = pd.read_csv('iris.csv') print(아이리스.shape) # 원핫인코딩 아이리스 = pd.get_dummies(아이리스) 아이리스.co.. 2023. 9. 5.