본문 바로가기

머신러닝

[Machine Learning] 지도학습(Supervised Learning)/ 비지도학습(Unsupervised Learning)/ 강화학습(Reinforcement Learning)

Machin Learning

1. 지도학습(Supervised Learning) - 라벨o

  1. 회기 (Prediction)
    회기 알고리즘은 Continuous Data를 바탕으로 결과를 예측
  2. 분류 (Classification)
    분류 알고리즘은 주어진 데이터의 Category / Class 예측

지도학습의 프로세스

Train Data로부터 하나의 함수가 유추되고 나면 해당 함수에 대한 평가를 통해 파라미터를 최적화(fit)한다. 이러한 평가를 위해 교차 검증(Cross-Validation)이 이용되며 이를 위해 검증 집합(Validation Set) 을 다음의 3가지로 나눈다.

  • 훈련 집합(A Training Set)
  • 검증 집합(A Validation Set)
  • 테스트 집합(A Test Set)

이러한 교차 검증(CV)을 통하여 훈련된 각 함수에 대해 정밀도(Precision)와 재현율(Recall)를 측정할 수 있다.

 

지도학습의 종류

  1. k-최근접 이웃 k-Nearest Neighbors
  2. 선형 회귀 Linear Regression
  3. 로지스틱 회귀 Logistic Regression
  4. 서포트 벡터 머신 Support Vector Machines(SVM)
  5. 결정 트리 Decision Tree 와 랜덤 포레스트 Random Forests
  6. 신경망 Neural networks

2. 비지도학습(Unsupervised Learning) - 라벨 x

  1. Clustering Data의 연관된 feature를 바탕으로 유사한 그룹을 생성
  2. 차원축소(Dimensionality Reduction)
    고차원의 데이터셋을 feature selection / feature extraction을 통해서 차원을 축소
  3. 연관규칙학습(Association Rule Learning)
    데이터셋의 feature들의 관계를 발견하는 방법 (feature-feature / feature-output이 아님)

데이터가 어떻게 구성되었는지를 알아내는 문제의 범주에 속한다. 이 방법은 지도 학습(Supervised Learning) 혹은 강화 학습(Reinforcement Learning)과는 달리 입력값에 대한 목표치가 주어지지 않는다.

 

비지도학습의 종류

  • 군집 clustering
    1. k-평균k-Means
      : 데이터셋을 클러스터 라는 그룹으로 나누는 작업. 한 클러스터 안의 데이터 포인트끼리는 매우 비슷하고, 다른 클러스터의 데이터 포인트와는 구분되도록 데이터를 나누는 것이 목표.
    2. 계층 군집 분석Hierarchical Cluster Analysis(HCA)
      :(덴드로그램), 알고리즘은 시작할 때 각 포인트를 하나의 클러스터로 지정하고, 그 다음 특정한 종료조건을 만족할 때까지 가장 비슷한 두 클러스터를 합쳐나갑니다. 지정된 개수의 클러스터가 남을 때까지 비슷한 클러스터를 합친다.
    3. 기댓값 최대화Expectation Maximization
  • 시각화visualization와 차원 축소dimensionality reduction
    1. 주성분 분석 Principal Component Analysis(PCA)
        : 특성들이 통계적으로 상관관계가 없도록 데이터셋을 회전시키는 기술
    2. 커널kernelPCA
    3. 지역적 선형 임베딩Locally-Linear Embedding(LLE)
    4. t-SNEt-distributed Stochastic Neighbor Embedding
  • 연관 규칙 학습Assiociation rule learning
    1. 어프라이어리Apriori
    2. 이클렛Eclat

 

3. 강화학습(Reinforcement Learning)

- 머신러닝의 한 형태, 기계에게 좋은 행동에 대해서는 보상, 그렇지 않은 경우는 처벌이라는 피드백을 통하여 행동에 대해 학습.
- 행동심리학에서 영감을 받았으며, 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법.