일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- MongoDB
- 토네이도
- BAEKJOON
- r
- 백준
- 연동
- online
- spring
- 자바스크립트
- 설치
- Judge
- API
- Tornado
- ubuntu
- AWS
- OrientDB
- 이클립스
- 저지
- 배열
- 연결
- 알고리즘
- mariadb
- Python
- r script
- 파이썬
- 자료형
- Java
- 오픈한글
- 프레임워크
- Framework
- Today
- Total
목록머신러닝/R (17)
맛동산
summary(dataset$price) sum(dataset$price) # NA 출력 # 결측데이터 제거 방법1sum(dataset$price, na.rm=T) # 2362.9 # 결측데이터 제거 방법2 - na포함 데이터 제거price2 30개 제거 # 결측데이터 처리(0으로 대체)x
install.packages(c("dplyr", "hflights"))install.packages("dplyr")library(dplyr)library(hflights) # 1. tbl_df() 함수 : 데이터셋 화면창 안에서 한 눈에 파악할 수 있는 데이터 구성hflights_df
install.packages('plyr')library(plyr) # 1) apply(matrix/data.frame, 1(행)/2(열), FUNC)apply(iris[-5], 2, mean) # 마지막건 factor형이라 뺌 # 4개 컬럼당 평균구 # 2) tapply(dataset, 집단변수(범주형변수-성별같은거,iris에선 species로 묶는것처럼), FUNC)tapply(iris$Sepal.Length, iris$Species, mean) # tapply(iris[-5], iris$Species, mean) 요렇게는 안되네tapply(iris$Sepal.Width, iris$Species, sum) # 한번에 한컬럼씩만되는군 # 2. ddply() : plyr 패키지 제공 함수 # 이친구가 t..
install.packages('plyr')library(plyr) x = data.frame(ID = c(1,2,3,4,5), height = c(160,171,173,162,165))y = data.frame(ID = c(5,4,1,3,2), weight = c(55,73,60,57,80)) # 1) join() : plyr패키지 제공 함수z
seq(-2, 2, by=.2) # 0.2씩 증가 (시작,끝,by)seq(length=10, from=-5, by=.2) # -5부터 10개 생성 (10개, -5부터, .2씩) rnorm(20, mean = 0, sd = 1) # 정규분포를 따르는 20개 데이터 생성runif(20, min=0, max=100) # 0~100사이의 20개 난수 생성 # 범위 지정 난수 발생 sample(0:100, 20) # 0~100사이의 20개 sample 생성 setwd("D:/Rwork/Part-I")excel 2ceiling(1.3) # 올림 -> 2floor(1.9) # 내림 -> 1 r3
# 논리연산자logical = 50 & num2
install.packages("stringr")library(stringr) # 문자열 추출 (정규표현식을 사용)str_extract("abcd12aaa33", "[0-9]{2}") # "12" -> 연속된 숫자2개 추출(첫번째)str_extract_all("abcd12aaa33", "[0-9]{2}") # "12" "33" -> 모두# 숫자도 문자열("12")로 추출됨 # 문자열 길이 구하기 str
# 1) Vector이용 객체 생성no
# python : dict = {"id":"hong", "name":"홍길동", "age":35}# R vector(3) = |"id":"hong"|"name":"홍길동"|"age":35|# 밖에서보면 백턴데 뜯어보면 dict형태인겨 # 1차원 리스트 : 1개의 원소를 갖는 리스트 : key 생략list
d