Text mining + Tag Cloud를 R로 그리기
문서를 입력받아(영어 ㅋㅋ) tm패키지와 wordcloud 패키지를 이용해서 그림을 그려보자.
install.packages("wordcloud")
install.packages("tm")
install.packages("SnowballC")
install.packages("Rcpp")
require(tm)
require(wordcloud)
require(SnowballC)
require(RColorBrewer)
require(Rcpp) #구버전의 Rcpp가 설치되어 있다면 install.packages("Rcpp")로 update해야 한다.
draw_cloudtag <- function(corpus,remove_words=NULL) {
lords.map <- tm_map(corpus,stripWhitespace)
lords.map <- tm_map(lords.map,tolower)
lords.map <- tm_map(lords.map,removeWords,stopwords("english"))
#영어(english)에서 사용되는 stopwors를 반환하여 removeWords에 대입
if(!is.null(remove_words)) {
lords.map <- tm_map(lords.map,removeWords,remove_words)
}
windows()
wordcloud(lords.map, scale=c(5,0.5),
max.words=100,
random.order=FALSE,
rot.per=0.35,
use.r.layout=FALSE,
colors=brewer.pal(8, "Dark2"))
}
#data가 있는 directory를 입력한다.이 디렉토리에는 파일이 한 개여야!
lords <- Corpus(DirSource(directory="corpus_directory"))
#inspect(lords)
# Corpus를 보여준다.
draw_cloudtag(lords,c("nobl","will","can","one"))
install.packages("wordcloud")
install.packages("tm")
install.packages("SnowballC")
install.packages("Rcpp")
require(tm)
require(wordcloud)
require(SnowballC)
require(RColorBrewer)
require(Rcpp) #구버전의 Rcpp가 설치되어 있다면 install.packages("Rcpp")로 update해야 한다.
draw_cloudtag <- function(corpus,remove_words=NULL) {
lords.map <- tm_map(corpus,stripWhitespace)
lords.map <- tm_map(lords.map,tolower)
lords.map <- tm_map(lords.map,removeWords,stopwords("english"))
#영어(english)에서 사용되는 stopwors를 반환하여 removeWords에 대입
if(!is.null(remove_words)) {
lords.map <- tm_map(lords.map,removeWords,remove_words)
}
windows()
wordcloud(lords.map, scale=c(5,0.5),
max.words=100,
random.order=FALSE,
rot.per=0.35,
use.r.layout=FALSE,
colors=brewer.pal(8, "Dark2"))
}
#data가 있는 directory를 입력한다.이 디렉토리에는 파일이 한 개여야!
lords <- Corpus(DirSource(directory="corpus_directory"))
#inspect(lords)
# Corpus를 보여준다.
draw_cloudtag(lords,c("nobl","will","can","one"))
댓글
댓글 쓰기