MachineLearning
분류 분석(Classification)
견오수
2021. 9. 17. 13:31
728x90
머신러닝에서 지도 학습(Supervised분류 분석(Classification)을 알아보겠습니다.
1. 분류분석이란?
- 미리 정의된 그룹으로 데이터를 분류를 한다.
- 클러스터링과 유사하지만 분류 분석은 각 그룹이 정의되어있다.
- 주어진 입력 변수에 근거하여 범주형 목표 변수를 예측하는 작업이다.
2. 지도학습지도 학습(Supervised Learning)
- 지도 학습은 목표 변수(정답)가 존재한다.
- 데이터에 각각 정답이 있다고 생각하면 된다. ex) 개 이미지에 개라고 알려주고, 고양이 이미지에 고양이라고 알려준다.
- 분류 : 목표 변수가 범주형이다.
- 추정/예측 : 목표 변수가 연속형이다.
3. 비지도학습비지도 학습(UnSupervised Learning)
- 목표 변수가 없이 데이터 내부의 특성을 이용한다.
- 군집분석, 연관분석, 연속 규칙 등이 비지도 학습에 속한다.
4. 분류 분석기법 종류
- 의사결정 나무 (Decision Tree)
- 인공신경망 (Neural Networks)
- SVM (Support Vector Machines)
- 앙상블 기법 (Ensemble Methods)
- KNN (k Nearest Neighborhood)
- 로지스틱 회귀분석 (Logistic Regression)
- 베이지안 분류 (Naive Bayes & Baysian Belief Networks)
5. 분류 모형의 종류
- 확률적 모형 : 주어진 데이터에 대해 각 카테고리 혹은 class가 정답일 조건부 확률을 계산하는 모형
- 확률적 판별 모형 : 직접 조건부 확률 함수의 모양을 추정하는 모형
- 확률적 생성 모형 : 베이즈 이론을 사용하여 간접적으로 조건부 확률을 구하는 모형
- 판별 함수 모형 : 주어진 데이터를 카테고리에 따라 서로 다른 영억으로 나누는 경계면을 찾아낸 다음 이 경계면으로부터 주어진 데이터가 어느 위치에 있는지를 계산하는 판별 함수를 이용하는 모형
모형 | 방법론 |
나이브 베이지안 | 확률적 생성모형 |
LDA/QDA | 확률적 생성모형 |
로지스틱 회귀 | 확률적 판별모형 |
의사결정나무 | 확률적 판별모형 |
퍼셉트론 | 판별함수 모형 |
서포트벡터머신 | 판별함수 모형 |
인공신경망 | 판별함수 모형 |
728x90