7월, 2015의 게시물 표시

연관규칙(Association Rule) 검색 - 초간단 튜토리얼

설치 저는 apriori 알고리즘으로 연관규칙 마이닝을 해보렵니다. 적합한 패키지는 {arules}입니다. 먼저 CRAN으로부터 필요한 것들을 내려받습니다. R> install.packages("arules") 거래명세서 연관규칙은 IF ... THEN ... 이라는 규칙에 따라 만들어집니다. 예를 들어 "사과를 구입했다면 주스를 구입한다."는 식입니다. 연관규칙을 생성하려면 규칙을 확률적으로 생성할 수 있도록 명세서를 줘야 합니다. 이를 특히 거래명세서라고 부릅니다. 거래명세서 오브젝트(transaction)를 여러 방법으로 만들어 봅시다. list 형태의 데이터 직관적이고 간편한 방법입니다. R> shopping_list = list(c("juice","coke")                                      ,c("milk","juice","soap")                                      ,c("juice","soap")                                      ,c("juice","soap","coke")                                      ,c("soap","coke")) 각각의 구입목록을 벡터로 하는 리스트를 생성했습니다. 예를 들어 1번 구매자는 주스와 콜라를, 2번 구매자는 우유, 주스, 비누를, 3번 구매자는 주스와 비누를 구입했습니다. R> shopping_transaction = as(shopping_list,"transactions") shopping_transaction이라는