Rのメモ

データフレーム操作

library(dplyr)
newdataset <- select(dataset, variable1, variable2, ...) # Choose necessary variables only
  1つのデータフレーム dataset から必要な変数(variable1, 2, ..)を抜粋して newdataset を作る 
filter(newdataset, variable1 > 56) %>% select(variable2, variable 1)
  newdataset の variable 1の値(ここでは56より大きい)でフィルタし、かつ変数2, 1 だけ値を表示
  %>% はこのコマンドを逐次的に実行するという意味
library(mosaic)
tally(~ is.na(variable), data=dataset)
favstats(~ variable, data=dataset)
min Q1 median Q3 max mean ad n missing

変数の再集計

> library(dplyr)
> library(memisc)
> newdataset = mutate(newdataset, new_variablename=
    cases(
       "LABEL A" = variable1==0,
       "LABEL B" = (variable1>0 & variable1<=1 & variable2<=3 & variable3==1) |
                             (variable1>0 & variable1<=2 & variable2<=4 & variable3==0),
       "LABEL C"    = ((variable1>1 | variable2>3) & variable3==1) |
                             ((variable1>2 | variable2>4) & variable3==0)))

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS