| 함수 | 분석 목적 | 검정 | 귀무가설(H0) |
| stats.shapiro() | 정규성 검정 | 데이터가 정규 분포를 따르는지 확인 | 데이터는 정규분포를 따른다. |
| stats.levene() | 등분산 검정 | 두 집단 이상에서 분산이 같은지 확인 | 모든 그룹의 분산은 같다. |
| stats.ttest_rel(after 데이터. berfore데이터 , alternative = '') | 대응표본 t검정 | 같은 대상의 전후 비교 | 두 시점 평균차이는 0이다. |
| stats.ttest_ind() | 독립표본 t검정 | 두 독립 집단 평균 비교 | 두 집단 평균은 같다. |
| stats.ttest_1samp() | 단일표본 t검정 | 하나의 그룹 평균이 특정 값과 다른지 비교 | 모평균은 기준값과 같다. |
| df.corr() / stats.pearsonr() | 상관계수 | 두 연속된 변수의 선형 관계 측정 | 상관계수 p=0(상관 없다) |
| ols() + anova_lm() | 분산분석(ANOVA) | 집단 간 평균 차이분석 (1개 이상 범주형 변수) | 모든 그룹 평균이 같다. |
| stats.f_oneway() | 일원분산분석 | 3그룹 이상의 독립 집단 평균 비교 | 모든 그룹 평균이 같다. |
| stats.chisquare | 카이제곱 적합도 | 관측된 범주형 데이터와 기대값과 일치 확인 | 관측 비율은 기대비율과 같다 |
| stats.chi2_contingency() | 카이제곱 독립성 검정 | 범주형 변수 간 관련성 확인 | 두 변수는 서로 독립이다. |
| quantile(), np.percentile() | 분위수 | 데이터의 특정 백분위 계산 | 요약통계 계산용 |
'🍅빅데이터 분석기사 > 정리' 카테고리의 다른 글
| 시계열 데이터 함수 정리 (0) | 2025.06.02 |
|---|---|
| Numpy 함수 정리 (0) | 2025.05.31 |
| statsmodels 회귀 / 분산분석 함수 정리 (0) | 2025.05.30 |
| Pandas 데이터 전처리 함수 (0) | 2025.05.30 |
| melt() (0) | 2025.05.29 |