범주 | 함수명 | 설명 |
파일 읽기 | pd.read_csv() | CSV파일 불러오기 |
결측치 처리 | isnull(), fillna(), dropna() | 결측치 탐지/ 대체/ 제거 |
조건 필터링 | df.loc[ ], df.query() | 조건으로 행 선택 |
정렬 | sort_values(), sort_index() | 값 또는 인덱스로 정렬 |
그룹별 연산 | groupby() + agg() / mean() | 그룹별 평균, 합계 |
열 변경 | rename(), drop(), astype() | 열 이름 변경, 열 삭제, 형 변환 |
데이터 통합 | concat() | 행방향 (위아래) 붙이기 |
데이터 통합 | merge() | 열방향 (옆으로) 붙이기 |
데이터 재구조화 | pivot(), melt() | wide <-> long 변환 |
동일 개수(분위수)로 구간 나누기 | pd.qcut(df['col'], q=3, labels = ['group1', 'group2', 'group3']) | 데이터를 동일 개수 구간(분위수)로 나눔 - 구간에 데이터 개수가 같음 |
등간격으로 구간 나누기 |
pd.cut(df['col'], bins=3, labels = ['청년', '중년', '노년']) | 값을 등간격 구간(범주)로 나눔 - 구간의 너비가 같음 |
'🍅빅데이터 분석기사 > 정리' 카테고리의 다른 글
시계열 데이터 함수 정리 (0) | 2025.06.02 |
---|---|
Numpy 함수 정리 (0) | 2025.05.31 |
statsmodels 회귀 / 분산분석 함수 정리 (0) | 2025.05.30 |
통계분석 함수 정리 (0) | 2025.05.30 |
melt() (0) | 2025.05.29 |