Text mining + Tag Cloud를 R로 그리기

문서를 입력받아(영어 ㅋㅋ) tm패키지와 wordcloud 패키지를 이용해서 그림을 그려보자.

install.packages("wordcloud")
install.packages("tm")
install.packages("SnowballC")
install.packages("Rcpp")
require(tm)
require(wordcloud)
require(SnowballC)
require(RColorBrewer)
require(Rcpp) #구버전의 Rcpp가 설치되어 있다면 install.packages("Rcpp")로 update해야 한다.
draw_cloudtag <- function(corpus,remove_words=NULL) {
  lords.map <- tm_map(corpus,stripWhitespace)
  lords.map <- tm_map(lords.map,tolower)
  lords.map <- tm_map(lords.map,removeWords,stopwords("english"))
  #영어(english)에서 사용되는 stopwors를 반환하여 removeWords에 대입
  if(!is.null(remove_words)) {
    lords.map <- tm_map(lords.map,removeWords,remove_words)
  }
  windows()
  wordcloud(lords.map, scale=c(5,0.5),
            max.words=100,
            random.order=FALSE,
            rot.per=0.35,
            use.r.layout=FALSE,
            colors=brewer.pal(8, "Dark2"))
}
#data가 있는 directory를 입력한다.이 디렉토리에는 파일이 한 개여야!
lords <- Corpus(DirSource(directory="corpus_directory"))
#inspect(lords)
# Corpus를 보여준다.
draw_cloudtag(lords,c("nobl","will","can","one"))



댓글

이 블로그의 인기 게시물

Bradley-Terry Model: paired comparison models

R에서 csv 파일 읽는 법

xlwings tutorial - 데이터 계산하여 붙여 넣기