[통계] 가설검정1 - Student T-test (ft. z-test)

Student T-test
목적: 두개의 집단이 통계적으로 같은지 다른지 비교하기 위해 사용
두집단의 평균값의 차이가 표준편차보다 현저히 작으면 이 차이는 우연히 밸생했다라고 결론, 반대로 두집단의 평균갓의 차이가 표준편차보다 현저히 크면 이 차이가 우연히 발생하지 않았다고 결론.

이 테스트를 개발한 사람의 필명이 Student 마지막 철자 T를 따서 T-test

모집단의 표준편차가 알려지지 않았을때 정규분포의 모집단에서 모은 샘플의 평균값에 대한 가설 검정방법

Z-test = 모집단의 정규분포
z transformation = 정규분포를 표준정규분포로 바꾸는 것 =표준화
z-score = (X-μ) / σ --> 관심있는 값-평균 / 표준편차 ==> 이후 값을 표준정규분포표에서 면적을 찾고 - 0.5 또는 1 해주면됨. // 단위로부터 자유로움 --> 이 값은 통계 확률값임.

T-test = 표본샘플의 정규분포

최대 2개의 샘플사용, 3개 이상은 ANOVA 분산분석을 이용한다.

선제되어야 하는 가정 3가지
1. 독립성
:두 그룹이 연결되어 있는 (paired) 쌍인지
2. 정규성
:데이터가 정규성을 나타는지
3. 등분산성
:두 그룹이 어느정도 유사한 수준의 분산 값을 가지는지

1. One Sample t-test : 1개의 sample값들의 평균이 특정값과 동일한지 비교.

t-value가 0이면 우연 0이 아니면 통계적으로 유의미하다. 즉, 두집단의 평균값인(편)차의 차이가 의미없는 편차인 표준편차 만도 못하다면 이 차이는 우연히 발생했다고 본다.
df(degree of freedom) = 자유도 = n-1
One side test(단측검정) vs Two side test(양측검정) : Ha(대립가설)의 차이에서 발생. '0'(μ)를 기준으로 95%안에 p-value가 들어오면 두 평균값의 차이인 Da-b는 우연히 발생한 것이므로 두집단의 평균값은 통계적으로 같은것.
- One side test(단측검정) : 샘플 데이터의 평균이 "X"보다 크다 혹은 작다 / 크지 않다 작지 않다. 를 검정하는 내용 단측은 '0'(μ)보다 크면 우측검정, 작으면 좌측검정으로 나뉨
좌측검정: '0'보다 작다 한쪽 꼬리의 면적이 5%만큼 크거나 작아야 한다.

- Two side (tail / direction) test(양측검정) : 샘플 데이터의 평균이 "X"와 같다 / 같지 않다. 를 검정하는 내용

신뢰구간 95%는 우연으로 발생된 확률이고, 양측 (tail/direction)의 5%는 유의미한 통계적 확률의 부분임.

2. Two Sample t-test : 2개의 sample값들의 평균이 서로 동일 한지 비교

1) H0(귀무가설) : 두 확률은 같다 (차이가 없다).

2) Ha(대안가설) : 같지 않다

이처럼 t-value값이 유의한지 아닌지를 판단하는 가설검정을 통해서 가지고 있는 데이터가 왜 유의미한지 (유의미하지않은지) 고민하고 데이터를 체크해 봐야한다.

Python 활용

'개념 이론 수학' 카테고리의 다른 글

[통계] 가설 검정 - 독립 변수 (Independent variable) / 종속변수 (Dependent variable) / 통제변수(control variable) (0)	2021.06.20
[통계] 가설검정2 - Type of Error (0)	2021.06.20
[통계] 가설검정 (0)	2021.06.20
[통계] 기술 통계치(Descriptive Statistics) / 추리 통계치(Inferetial Statistics) (0)	2021.06.20
[수학] 경사하강법 (Gradient Descent) (0)	2021.06.09

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Data Scientist Kimmaa's log

[통계] 가설검정1 - Student T-test (ft. z-test)

T-test = 표본샘플의 정규분포

1. One Sample t-test : 1개의 sample값들의 평균이 특정값과 동일한지 비교.

2. Two Sample t-test : 2개의 sample값들의 평균이 서로 동일 한지 비교

'개념 이론 수학' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역

[통계] 가설검정1 - Student T-test (ft. z-test)

T-test = 표본샘플의 정규분포

1. One Sample t-test : 1개의 sample값들의 평균이 특정값과 동일한지 비교.

2. Two Sample t-test : 2개의 sample값들의 평균이 서로 동일 한지 비교

'개념 이론 수학' 카테고리의 다른 글

'개념 이론 수학' Related Articles

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역