MachineLearning

분류 분석(Classification)

견오수 2021. 9. 17. 13:31
728x90

머신러닝에서 지도 학습(Supervised분류 분석(Classification)을 알아보겠습니다.

 

 

1. 분류분석이란?

 

  • 미리 정의된 그룹으로 데이터를 분류를 한다.
  • 클러스터링과 유사하지만 분류 분석은 각 그룹이 정의되어있다.
  • 주어진 입력 변수에 근거하여 범주형 목표 변수를 예측하는 작업이다.

 

2. 지도학습지도 학습(Supervised Learning)

 

  • 지도 학습은 목표 변수(정답)가 존재한다.
  • 데이터에 각각 정답이 있다고 생각하면 된다. ex) 개 이미지에 개라고 알려주고, 고양이 이미지에 고양이라고 알려준다.
  • 분류 : 목표 변수가 범주형이다.
  • 추정/예측 : 목표 변수가 연속형이다.

3. 비지도학습비지도 학습(UnSupervised Learning)

 

  • 목표 변수가 없이 데이터 내부의 특성을 이용한다.
  • 군집분석, 연관분석, 연속 규칙 등이 비지도 학습에 속한다.

 

4. 분류 분석기법 종류

  • 의사결정 나무 (Decision Tree)
  • 인공신경망 (Neural Networks)
  • SVM (Support Vector Machines)
  • 앙상블 기법 (Ensemble Methods)
  • KNN (k Nearest Neighborhood)
  • 로지스틱 회귀분석 (Logistic Regression)
  • 베이지안 분류 (Naive Bayes & Baysian Belief Networks)

 

 

5. 분류 모형의 종류

 

  • 확률적 모형 : 주어진 데이터에 대해 각 카테고리 혹은 class가 정답일 조건부 확률을 계산하는 모형

 

- 확률적 판별 모형 : 직접 조건부 확률 함수의 모양을 추정하는 모형

- 확률적 생성 모형 : 베이즈 이론을 사용하여 간접적으로 조건부 확률을 구하는 모형

 

  • 판별 함수 모형 : 주어진 데이터를 카테고리에 따라 서로 다른 영억으로 나누는 경계면을 찾아낸 다음 이 경계면으로부터 주어진 데이터가 어느 위치에 있는지를 계산하는 판별 함수를 이용하는 모형

 

모형 방법론
나이브 베이지안 확률적 생성모형
LDA/QDA 확률적 생성모형
로지스틱 회귀 확률적 판별모형
의사결정나무 확률적 판별모형
퍼셉트론 판별함수 모형
서포트벡터머신 판별함수 모형
인공신경망 판별함수 모형

 

 

 

 

 

 

728x90