R

R

【R】dataframeの時刻変換(型変換)を高速で行う方法

普段はas.POSIXctを使用しているが、こいつがマジで遅い。高速で処理するにはfasttimeを使う。 install.packages("fasttime") 100万行単位のdataframeで検証...
R

【R】naのある行の抽出

naが含まれる行を抽出 subset(df, is.na(df$COLUMN_A))
R

【R】dplyr::summariseの使い方

summarise_atで列を指定して関数を適用する statistics_data.table <- statistics_data.table %>% dplyr::group_by(RACE_CODE, UMA...
R

【R】dummies:ダミー変数の作り方

dummiesパッケージを使用する # インストール install.packages("dummies", dependencies = TRUE) #パッケージの読み込み library("d...
R

【R】read.csv/write.csvで読み込み、書き込み

read.csv # データ読み込み read.table <- read.csv( file_name, # 読み込むファイル名 colClasses=c("character"), # 読み...
R

【R】dplyrで集計:group_byした値ごとに件数をカウントする

忘れるのでメモ # グレードコードの値ごとに件数を集計する tmp <- processed_data.table %>% dplyr::group_by(GRADE_CODE) %>% dplyr::...
R

【R】dplyrの中で変数を使う方法

dplyrの中では普通に変数を使えない。たとえば、mutateしようとすると変数名が新規追加カラムとして扱われ、変数の中の値が展開されない。 対処方法① mutateの直後に来る値には!!をつけ、その後の=を:=にする。 ...