ADsP/3과목

5장_4절 연관분석1

hyerimir 2022. 2. 17. 15:37

1. 연관분석

1) 개요

- 기업의 데이터베이스에서 상품의 구매, 서비스 등 일련의 거래 또는 사건들 간의 규칙을 발견하기 위한 분석 흔히 장바구니 분석(Market Basket Analysis), 순차분석(Sequence Analysis) 등이 있음

- 장바구니 분석 : 장바구니에 무엇이 같이 들어있는지에 대해 분석

예) 주말을 위해 목요일에 기저귀를 사러 온 30대 직장인 고객은 맥주도 함께 사감

- 순차분석 : 구매 이력을 분석해서 A품목을 산 후 추가 B품목을 사는지를 분석

예) 휴대폰을 새로 구매한 고객은 한달 내에 휴대폰 케이스를 구매

 

2) 형태

- 조건과 반응의 형태(if - then)

If A then B : 만일 A가 일어나면 B가 일어난다

 

3) 측도

  • 지지도(support)

전체 거래 중 항목 A와 항목 B를 동시에 포함하는 거래의 비율로 정의

 

  • 신뢰도(confidence)

항목 A를 포함한 거래 중에서 항목 A와 B가 같이 포함될 확률, 연관성의 정도를 파악할 수 있음

 

  • 향상도(lift)

A가 주어지지 않았을 때의 품목 B의 확률에 비해 A가 주어졌을 때의 품목 B의 확률의 증가 비율

연관규칙 A -> B는 품목 A와 품목 B의 구매가 서로 관련이 없는 경우에 향상도가 1이 됨

> 향상도 = (A와 B가 동시에 포함된 거래수)/(A를 포함하는 거래수)*(B를 포함하는 거래수)