1. Association Rule Mining이란?
- 변수들 (feature) 간데 얼마나 연관성을 갖는지
- 인과관계까지 알 수 있는 것은 아님!
2. 용어
- Antecedent : " IF " 조건절)
- Consequent : " Then " (결과절)
- Item set : 조건절과 결과절을 구성하는 item들의 집합
- 조건절과 결과절에는 공통된 item 존재하지 않음!
3. A → B (A를 사면 B도 사더라)
1) Support (지지도)
Support ( A → B) = P(A) or P(A,B)
이 때, P(A) : 조건절이 발생할 확률이고, P(A,B)는 두개가 함께 발생할 확률을 말한다.
원래 이론은 P(A)를 의미하지만, 실제로는 P(A,B) 를 사용한다고 한다.
2) Confidence (신뢰도)
confidence(A→B)=P(A,B)P(A)
: A를 구매했을 때, A와 B가 모두 동시에 구매될 확률 (조건부확률)
3) Lift (향상도)
lift(A→B)=P(A,B)P(A)P(B)
- = 1 : A, B는 서로 독립 (A, B 무조건 같이 구매)
- > 1 : 긍정적 연관성
- < 1 : 부정적 연관성
'ASAC 5기 > Machine Learning' 카테고리의 다른 글
09. [Clustering] Clustering 평가지표 (0) | 2024.08.13 |
---|---|
08. [Clustering] Hierarchical Clustering (0) | 2024.08.13 |
07. [Clustering] DBSCAN (0) | 2024.08.13 |
06. Regression Model (0) | 2024.07.22 |
05. Linear Regression 관련 용어 (2) | 2024.07.17 |
댓글