본문 바로가기

통계이론

[Machine Learning] 지도학습(Supervised Learning)/ 비지도학습(Unsupervised Learning)/ 강화학습(Reinforcement Learning) Machin Learning 1. 지도학습(Supervised Learning) - 라벨o 회기 (Prediction) 회기 알고리즘은 Continuous Data를 바탕으로 결과를 예측 분류 (Classification) 분류 알고리즘은 주어진 데이터의 Category / Class 예측 Train Data로부터 하나의 함수가 유추되고 나면 해당 함수에 대한 평가를 통해 파라미터를 최적화(fit)한다. 이러한 평가를 위해 교차 검증(Cross-Validation)이 이용되며 이를 위해 검증 집합(Validation Set) 을 다음의 3가지로 나눈다. 훈련 집합(A Training Set) 검증 집합(A Validation Set) 테스트 집합(A Test Set) 이러한 교차 검증(CV)을 통하여 훈.. 더보기
[통계] 기술 통계치(Descriptive Statistics) / 추리 통계치(Inferetial Statistics) 기술 통계치(Descriptive Statistics) 수집한 데이터를 요약, 묘사, 설명하는 통계 기법 데이터의 집중화 경향 값 (Central tendecy) : 대표값 mean(평균) : (정략적 자료의 대표값) 이상치의 영향을 많이 받음 - 산술 평균(Arithmetic mean): 데이터 n 개를 모두 더해서 n개로 나눈값 - 기하평균(geometirc mean), - 조화평균 (Harmonic mean) - 가중평균 (Weighted mean median(중앙값) : (순위자료의 대표값) mode(최빈값) : 명목자료의 대표값 min max count 데이터의 분산도 값 (Variation) range (범위) : 자료의 최대값과 최소값의 차이 (max-min) Variance (분산) : 편.. 더보기