함수 분석 목적 검정 귀무가설(H0)
stats.shapiro() 정규성 검정 데이터가 정규 분포를 따르는지 확인 데이터는 정규분포를 따른다.
stats.levene() 등분산 검정 두 집단 이상에서 분산이 같은지 확인 모든 그룹의 분산은 같다.
stats.ttest_rel(after 데이터. berfore데이터 , alternative = '') 대응표본 t검정 같은 대상의 전후 비교 두 시점 평균차이는 0이다.
stats.ttest_ind() 독립표본 t검정 두 독립 집단 평균 비교 두 집단 평균은 같다.
stats.ttest_1samp() 단일표본 t검정 하나의 그룹 평균이 특정 값과 다른지 비교 모평균은 기준값과 같다.
df.corr() / stats.pearsonr() 상관계수 두 연속된 변수의 선형 관계 측정 상관계수 p=0(상관 없다)
ols() + anova_lm() 분산분석(ANOVA) 집단 간 평균 차이분석 (1개 이상 범주형 변수) 모든 그룹 평균이 같다.
stats.f_oneway() 일원분산분석 3그룹 이상의 독립 집단 평균 비교 모든 그룹 평균이 같다.
stats.chisquare 카이제곱 적합도 관측된 범주형 데이터와 기대값과 일치 확인 관측 비율은 기대비율과 같다
stats.chi2_contingency() 카이제곱 독립성 검정 범주형 변수 간 관련성 확인 두 변수는 서로 독립이다.
quantile(), np.percentile() 분위수 데이터의 특정 백분위 계산 요약통계 계산용

 

'빅데이터 분석기사 > 정리' 카테고리의 다른 글

시계열 데이터 함수 정리  (0) 2025.06.02
Numpy 함수 정리  (0) 2025.05.31
statsmodels 회귀 / 분산분석 함수 정리  (0) 2025.05.30
Pandas 데이터 전처리 함수  (0) 2025.05.30
melt()  (0) 2025.05.29