🔷기본 함수

1. help

help 함수는 R의 도움말 시스템을 호출하여 특정 함수나 주제에 대한 문서를 제공합니다. ? 연산자도 동일한 기능을 합니다.

# 함수에 대한 도움말 보기
help(paste)
# 또는
?paste

2. paste

paste 함수는 여러 문자열을 결합하는 함수입니다. paste0 함수는 공백 없이 문자열을 결합합니다.

# 기본 사용법
str1 <- "Hello"
str2 <- "World"
result <- paste(str1, str2)
print(result)  # 출력: "Hello World"

# 구분자 지정
result <- paste(str1, str2, sep = ", ")
print(result)  # 출력: "Hello, World"

# paste0 사용 예시
result <- paste0(str1, str2)
print(result)  # 출력: "HelloWorld"

3. seq

seq 함수는 수열(sequence)을 생성하는 함수입니다. 시작 값, 끝 값, 증가값 등을 지정할 수 있습니다.

# 1부터 10까지의 수열 생성
sequence <- seq(1, 10)
print(sequence)  # 출력: 1 2 3 4 5 6 7 8 9 10

# 1부터 10까지 2씩 증가하는 수열 생성
sequence <- seq(1, 10, by = 2)
print(sequence)  # 출력: 1 3 5 7 9

# 1부터 10까지 총 5개의 숫자를 균등하게 배치
sequence <- seq(1, 10, length.out = 5)
print(sequence)  # 출력: 1 3.25 5.5 7.75 10

4. rep

rep 함수는 주어진 값을 반복하는 함수입니다. 반복 횟수 또는 패턴을 지정할 수 있습니다.

# 숫자 1을 5번 반복
repeated <- rep(1, 5)
print(repeated)  # 출력: 1 1 1 1 1

# 벡터를 3번 반복
repeated <- rep(c(1, 2, 3), 3)
print(repeated)  # 출력: 1 2 3 1 2 3 1 2 3

# 각 요소를 지정된 횟수만큼 반복
repeated <- rep(c(1, 2, 3), each = 2)
print(repeated)  # 출력: 1 1 2 2 3 3

5. rm

rm 함수는 R 환경에서 변수 또는 객체를 삭제하는 함수입니다.

# 변수 생성
x <- 10
y <- 20

# 변수 삭제
rm(x)

# 변수 목록 확인
print(ls())  # 출력: "y" (x는 삭제되었기 때문에 출력되지 않음)

6. ls

ls 함수는 현재 R 환경에 존재하는 객체(변수, 함수 등)의 이름을 반환합니다.

# 변수 생성
a <- 1
b <- 2

# 현재 환경의 객체 목록 확인
print(ls())  # 출력: "a" "b"

# 특정 패턴의 객체 목록 확인
print(ls(pattern = "a"))  # 출력: "a"

7. print

print 함수는 객체의 내용을 출력하는 기본 함수입니다. 주로 결과를 화면에 출력할 때 사용됩니다.

# 숫자 출력
print(123)

# 문자열 출력
print("Hello, World!")

# 벡터 출력
vec <- c(1, 2, 3)
print(vec)

 

 

🔷통계 함수

sum() : 벡터 또는 숫자의 합을 계산합니다.

mean() : 평균을 계산합니다.

median() : 중앙값을 계산합니다.

var() : 분산을 계산합니다.

sd() : 표준 편차를 계산합니다.

max(), min() : 최댓값과 최솟값을 계산합니다.

range() : 범위를 계산합니다.

summary() : 데이터의 기술 통계량을 요약하여 보여줍니다

skewness() : 입력된 값의 왜도를 구한다.

kurtosis() : 입력된 값의 첨도를 구한다.

 

vec <- c(1, 2, 3, 4, 5)
total_sum <- sum(vec)
print(total_sum)  # 출력: 15


avg <- mean(vec)
print(avg)  # 출력: 3


med <- median(vec)
print(med)  # 출력: 3


variance <- var(vec)
print(variance)  # 출력: 2.5


std_dev <- sd(vec)
print(std_dev)  # 출력: 1.581139


maximum <- max(vec)
minimum <- min(vec)
print(maximum)  # 출력: 5
print(minimum)  # 출력: 1


range_val <- range(vec)
print(range_val)  # 출력: 1 5


summary_stats <- summary(vec)
print(summary_stats)
# 출력:
#   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.
#   1.00    2.25    3.00    3.00    4.00    5.00


library(e1071)
skew <- skewness(vec)
print(skew)


kurt <- kurtosis(vec)
print(kurt)

 

 

 

[참고 도서]

출처 :

이지패스 2024 ADsP 데이터분석 준전문가