‼️ 차이점은 ddof (자유도)의 기본값 차이
⚫np.std() (NumPy의 표준편차)
- 기본값 ddof = 0
⚫ Series.std() (Pandas의 표준편차)
- 기본값 ddof = 1
🚩 즉, 두 함수의 기본 자유도 차이(ddof)로 결과가 달라질 수 있음!
- 실제 값 차이 예시
(n=5일 때, 단순 예시)- 모집단: 분모가 5 (n)
- 표본: 분모가 4 (n-1)
- 실기/실무에서 표본 표준편차(ddof=1)가 기본입니다.
np.std() (NumPy의 표준편차) | Series.std() (Pandas의 표준편차) |
![]() |
![]() |
기본값 ddof = 0 | 기본값 ddof = 1 |
- "어떤 방식의 표준편차를 요구하는지"
- 공식 예시에서 pandas로 했는지, numpy로 했는지, ddof=0 또는 1인지 확인
- 정답이 소수점 단위까지 요구될 때는,
무조건 pandas의 std()로 통일하거나
np.std(..., ddof=1)로 맞춰주는 것이 안전함!
❌np.var() 도 pandas().var()과 다름
- np.var() 도 ddof = 1을 꼭 기입
- pandas는 기본값
'🍅빅데이터 분석기사 > 정리' 카테고리의 다른 글
corr , stats.pearsonr(df['x'], df['y']) (0) | 2025.06.15 |
---|---|
import warnings [python 경고메시지 무시] (0) | 2025.06.12 |
빅데이터분석기사 실기체험 3번 (0) | 2025.06.07 |
빅데이터분석기사 실기체험 2번 (0) | 2025.06.07 |
빅데이터분석기사 실기체험 1번 (0) | 2025.06.06 |