함수 |
분석 목적 |
검정 |
귀무가설(H0) |
stats.shapiro() |
정규성 검정 |
데이터가 정규 분포를 따르는지 확인 |
데이터는 정규분포를 따른다. |
stats.levene() |
등분산 검정 |
두 집단 이상에서 분산이 같은지 확인 |
모든 그룹의 분산은 같다. |
stats.ttest_rel(after 데이터. berfore데이터 , alternative = '') |
대응표본 t검정 |
같은 대상의 전후 비교 |
두 시점 평균차이는 0이다. |
stats.ttest_ind() |
독립표본 t검정 |
두 독립 집단 평균 비교 |
두 집단 평균은 같다. |
stats.ttest_1samp() |
단일표본 t검정 |
하나의 그룹 평균이 특정 값과 다른지 비교 |
모평균은 기준값과 같다. |
df.corr() / stats.pearsonr() |
상관계수 |
두 연속된 변수의 선형 관계 측정 |
상관계수 p=0(상관 없다) |
ols() + anova_lm() |
분산분석(ANOVA) |
집단 간 평균 차이분석 (1개 이상 범주형 변수) |
모든 그룹 평균이 같다. |
stats.f_oneway() |
일원분산분석 |
3그룹 이상의 독립 집단 평균 비교 |
모든 그룹 평균이 같다. |
stats.chisquare |
카이제곱 적합도 |
관측된 범주형 데이터와 기대값과 일치 확인 |
관측 비율은 기대비율과 같다 |
stats.chi2_contingency() |
카이제곱 독립성 검정 |
범주형 변수 간 관련성 확인 |
두 변수는 서로 독립이다. |
quantile(), np.percentile() |
분위수 |
데이터의 특정 백분위 계산 |
요약통계 계산용 |