흔히 R에서 MySQL을 사용하려면 RMySQL 패키지를 활용하는 방법이 일반적으로 채택된다. 그러나 이 방법은 복잡한 SQL 구문을 사용해야 해서 매우 귀찮다. 당신이 SQL도 잘 모르겠고 RMySQL의 속도도 별로 마음에 들지 않는데다 경우에 따라서 쿼리를 여러 가지로 파생해서 사용해야 한다면 어떻게 할까? 내가 권장하는 정답은 dplyr이다. 사실, 이 포스트는 ICIS2015에 가서 어떤 분이 한 질문 때문에 쓴다. 이 분께서 나에게 R에서 데이터베이스를 어떻게 쓰냐고 질문하셨는데 당시 불친절하게도 DBI기반의 패키지나 dplyr을 쓰시면 됩니다라고 했다. -_-;;; 생각해 보니 dplyr을 사용하는 방법에 대해 블로그에 올려두지 않았다는 것이 불현듯 오늘 아침 떠올라 긴급 포스팅을 한다. dplyr 설치하기 R> install.packages("dplyr") 설치가 되면 R에서 MySQL을 사용하기 위해 필요한 준비가 다 끝난다. 이제 여러분 컴퓨터에 MySQL이 설치되어 있고, 서버가 실행 중이며, localhost를 사용하고, user의 ID가 user 패스워드는 password라고 가정하자. 이때 데이터베이스 이름은 test_db라고 하자. MySQL 연결하기/끊기 R> con = src_mysql(dbname="test_db", user="user",password="password",host="localhost") 함수 src_mysql (source from mysql)을 실행하여 con에 할당한다. 연결을 끊는 방법은 con을 메모리에서 해제하는 것이다. R> rm(con) MySQL 쿼리 dplyr 패키지는 chain rule을 이용한다. 보다 자세한 것은 이 블로그의 다른 글을 참조. 바로가기 R> test_table_ref <-