2월, 2019의 게시물 표시

R에서 csv 파일 읽는 법

R은 read.csv() 함수를 기본으로 제공합니다. 그러나 여러분이 이 함수를 쓰면 안되는 몇 가지 이유가 있습니다. 우선 느립니다! 다른 이유는 아실 필요 없겠습니다. 느립니다!!! 대안으로 readr 패키지의 read_csv() 함수를 추천합니다. 그런데, 이 함수는 기본적으로 UTF-8 인코딩된 CSV 파일에 맞춰 설계되었습니다. 대부분의 한국 데이터가 EUC-KR 형식의 CSV이기 때문에 호환이 안된다고 불평하십니다. 안되긴요... 여러분이 한글 Windows를 쓰고 있고, Excel에서 CSV로 뽑은(즉 EUC-KR 혹은 CP949) 형식일 때, > library(readr) > my_data = read_csv("myfile.csv",locale=locale('ko',encoding='euc-kr')) 이렇게 하시면 됩니다. 그냥 UTF-8 형식이었다면 > my_data = read_csv("myfile.csv") 이렇게 하면 됩니다.

행과 열을 결합하기

R에서 행이나 열을 결합하는 방법은? > library(dplyr) 이제 열은 동일한 두 개의 객체 A와 B가 있다고 합시다. 이들을 합치려면? > C<-bind_rows(A,B) 만약, 열이 다르고 행의 길이는 같은 A, B를 합치려면? > C<-bind_cols(A,B) 특히 bind_cols()는 데이터 정리할 때 자주 쓰는 편입니다. 꼭 알아두세요.

Excel 파일을 R에서 읽어야 한다고?

여러 대안이 소개되었지만, 여러분에게 추천드리고 싶은 패키지는 단 하나입니다. 바로 readxl > library(readxl) > my_data <- read_excel("my_data.xlsx") 쉽죠? 이외의 패키지들은 고려하지 말아주세요.