ADsP/3과목
3장_1절 데이터 변경 및 요약1
hyerimir
2022. 2. 10. 16:13
1. 데이터 마트
데이터 웨어하우스와 사용자 사이의 중간층에 위치한 것으로 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스라고 할 수 있다
2. 요약변수와 파생변수
- 요약변수
- 수집된 정보를 분석에 맞게 종합한 변수로 데이터마트에서 가장 기본적인 변수
- 많은 모델이 공통으로 사용할 수 있어 재활용성 높음
예시) 기간별 구매 금액, 횟수, 여부/ 위클리 쇼퍼/ 상품별 구매 금액, 횟수, 여부/상품별 구매 순서/유통 채널별 구매 금액/ 단어 빈도/ 초기 행동변수/ 트랜드 변수/ 결측값과 이상값 처리/ 연속형 변수의 범주화
트랜드 변수 - 추이값을 나타내는 변수
- 파생변수
- 사용자(분석가)가 특정 조건을 만족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수
- 매우 주관적일 수 있으므로 논리적 타당성을 갖출 필요가 있다
예시) 근무시간 구매지수/ 주 구매 매장 변수/ 주 활동 지역 변수/ 주 구매 상품 변수/ 구매 상품 다양성 변수/ 선호하는 가격대 변수/ 시즌 선호 고객 변수/ 라이프 스테이지 변수/ 라이프스타일 변수/ 휴면가망 변수/ 최대가치 변수/ 최적 통화시간 등