일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- r script
- MongoDB
- API
- 연결
- Judge
- Tornado
- 토네이도
- Python
- 저지
- 배열
- 백준
- 파이썬
- AWS
- online
- OrientDB
- ubuntu
- 자료형
- 프레임워크
- 이클립스
- Java
- Framework
- r
- mariadb
- 알고리즘
- 자바스크립트
- spring
- 연동
- 설치
- BAEKJOON
- 오픈한글
- Today
- Total
목록r (17)
맛동산
터미널에서 > sudo R 을 입력하여 R을 실행 후 install.packages('KoNLP')를 입력하면 다채로운 에러가 발생. Windows R에서 KoNLP를 설치하면 의존되는 패키지를 자동으로 설치해주지만 리눅스는 권한문제 때문인지 한땀 한땀 설치해줘야 하는게 많았음. 1. 특히 rJava가 필수적으로 설치되어있으야 하는데 rJava를 설치하기 위해선 jdk가 선행으로 설치되어있어야함. 혹 터미널에서 >java -version을 입력했을때 아무 정보도 나오지 않는다면http://tastydarr.tistory.com/244의 4번 항목을 보고 jdk를 설치 2. 터미널에서 >sudo apt-get install r-cran-rjava 명령을 입력하고R script에서 install.packag..
터미널에 아래의 명령어를 입력하면 작성일 기준으로 R-3.4.0이 설치됨. > sudo echo "deb http://cran.rstudio.com/bin/linux/ubuntu xenial/" | suto tee -a /etc/apt/sources.list > gpg --keyserver keyserver.ubuntu.com --recv-key E084DAB9> gpg -a --export E084DAB9 | sudo apt-key add - > sudo apt-get update> sudo apt-get install r-base 설치 완료 후 sudo R을 입력하면 R script를 사용할 수 있음. 다음은 KoNLP 패키지 설치방법을 보겠음.
summary(dataset$price) sum(dataset$price) # NA 출력 # 결측데이터 제거 방법1sum(dataset$price, na.rm=T) # 2362.9 # 결측데이터 제거 방법2 - na포함 데이터 제거price2 30개 제거 # 결측데이터 처리(0으로 대체)x
install.packages(c("dplyr", "hflights"))install.packages("dplyr")library(dplyr)library(hflights) # 1. tbl_df() 함수 : 데이터셋 화면창 안에서 한 눈에 파악할 수 있는 데이터 구성hflights_df
install.packages('plyr')library(plyr) # 1) apply(matrix/data.frame, 1(행)/2(열), FUNC)apply(iris[-5], 2, mean) # 마지막건 factor형이라 뺌 # 4개 컬럼당 평균구 # 2) tapply(dataset, 집단변수(범주형변수-성별같은거,iris에선 species로 묶는것처럼), FUNC)tapply(iris$Sepal.Length, iris$Species, mean) # tapply(iris[-5], iris$Species, mean) 요렇게는 안되네tapply(iris$Sepal.Width, iris$Species, sum) # 한번에 한컬럼씩만되는군 # 2. ddply() : plyr 패키지 제공 함수 # 이친구가 t..
install.packages('plyr')library(plyr) x = data.frame(ID = c(1,2,3,4,5), height = c(160,171,173,162,165))y = data.frame(ID = c(5,4,1,3,2), weight = c(55,73,60,57,80)) # 1) join() : plyr패키지 제공 함수z
seq(-2, 2, by=.2) # 0.2씩 증가 (시작,끝,by)seq(length=10, from=-5, by=.2) # -5부터 10개 생성 (10개, -5부터, .2씩) rnorm(20, mean = 0, sd = 1) # 정규분포를 따르는 20개 데이터 생성runif(20, min=0, max=100) # 0~100사이의 20개 난수 생성 # 범위 지정 난수 발생 sample(0:100, 20) # 0~100사이의 20개 sample 생성 setwd("D:/Rwork/Part-I")excel 2ceiling(1.3) # 올림 -> 2floor(1.9) # 내림 -> 1 r3
# 논리연산자logical = 50 & num2
install.packages("stringr")library(stringr) # 문자열 추출 (정규표현식을 사용)str_extract("abcd12aaa33", "[0-9]{2}") # "12" -> 연속된 숫자2개 추출(첫번째)str_extract_all("abcd12aaa33", "[0-9]{2}") # "12" "33" -> 모두# 숫자도 문자열("12")로 추출됨 # 문자열 길이 구하기 str
# 1) Vector이용 객체 생성no