머신러닝/R
stringr
오지고지리고알파고포켓몬고
2017. 3. 26. 18:04
install.packages("stringr")
library(stringr)
# 문자열 추출 (정규표현식을 사용)
str_extract("abcd12aaa33", "[0-9]{2}") # "12" -> 연속된 숫자2개 추출(첫번째)
str_extract_all("abcd12aaa33", "[0-9]{2}") # "12" "33" -> 모두
# 숫자도 문자열("12")로 추출됨
# 문자열 길이 구하기
str <- 'hongkildong35lee45kang55유관순25'
length(str) # 1 # 얘는 그냥 한덩이로 봄
str_length(str) # 29
# 부분 문자열
str_s <- str_sub(str, 5, 15)
str_s
# 문자열 교체
str2 <- '홍길동,이순신,유관순'
str_replace_all(str2, '홍길동', '김길동')
# 문자열 분리
str_p <- str_split(str2, ',') # list로 반환
str_p
# 문자열 결합 - paste() : base 패키지 제공(stringr이 아녀~)
str3 <- c('홍길동', '이순신', '유관순')
str_result <- paste(str3, collapse = ',') # 파이썬 join이랑 같은거!
str_result # "홍길동,이순신,유관순"