STUDY-LOG

[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 11주차 본문

데이터분석 부트캠프/학습일지

[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 11주차

dyo_33 2024. 1. 5. 03:23

 

Tableau Dashboard (출처: tableau.com)

 

 

 

 

 

Tableau로 데이터 시각화하기2

 

 

 

 

Tableau

데이터를 탐색 및 관리하고, 인사이트를 더 빠르게 발견할 수 있는 데이터 시각화 BI 

 

 

 

< Highlight Table >

테이블을 직관적으로 표현하는 방식인 하이라이트 테이블

 

- 분석 대상이 되는 차원(address)과 측정값(sales)을 선택 후 표현방식에서 '하이라이트 테이블' 클릭

  (cf. Windows는 ctrl, Mac은 cmd 키 잡고 클릭) 

- 또는 뷰에 드래그해서 테이블 우선 생성 후 색 입히기 

- 측정값 (Sales)을 마크카드의 레이블, 색상에 드래그 

- 마크카드 '사각형'으로 변경

- 열/행 총합계도 추가 가능 → 분석 패널에서 '총계'를 뷰 안으로 드래그

 

- 총합계를 없애고 싶으면 분석 총계 체크된 항목 해제 + 모든 소계 제거

 

 

- 측정값을 여러개 지정할 수도 있음  

- 추가하고 싶은 측정값을 단순히 워크시트에 끌어다 놓는다면 서로 다른 측정값 범위로 인해 이슈 발생

왼쪽: 측정값 Profit // 오른쪽: 측정값 Sales 추가

 

 

- 색상카드의 측정값을 우클릭 후 별도의 범례 사용을 통해 색상을 다르게 표현

 

- Index()를 사용한 하이라이트 테이블

 

- 열선반에 Order date (년, 분기), 행선반에 Order date (월) 넣기

- 행선반 더블클릭 후 INDEX() 생성 → 불연속형으로 바꿔주기

- index는 번호표를 뽑아 줄을 세우는 것과 비슷. INDEX() 우클릭 후 [테이블 계산 편집 특정 차원에서 '월'만 클릭

 

 

 


 

 

< Filter >

- 필터는 태블로의 본질과 맞닿아 있는 기능
- 다양한 스토리텔링 가능
- Order of Operations를 구성하는 핵심 요소

위에서 아래방향으로 실행

 

 

>> 추출 필터 (Extract Filter)

데이터 원본창에서 연결방식을 추출로 선택

- 데이터 추출을 사용할 때만 적용 가능

- 다른 모든 필터에 앞서 적용되기 때문에 반환되는 레코드 수를 줄일 수 있음

 

 

 

 

>> 데이터 원본 필터 (Data Source Filter)

- 라이브 연결에서 사용할 수 있는 최상위 필터

- 데이터 원본 자체에 제한을 둠. 최종 사용자가 실수로 대규모 쿼리를 실행하지 못하도록 방지 및 대시보드 성능 개선

데이터 원본창에서 라이브 선택 후 필터 추가

- 라이브의 필터편집에서 데이터의 일부만 가져올 수 있음

 

 

 

 

>> 차원 필터 (Dimension Filter)

- 데이터 탐색에서 가장 많이 활용되는 필터

- 원하는 데이터만 필터링을 통해 볼 수 있음

좌: 필터링 전 우: 필터링 후

- 필터링 하고 싶은 차원을 우클릭 후 '필터표시'

 

 

 

 

>> 측정값 필터 (Measure Filter)

- 태블로의 집계방식에는 두가지가 있음 → Row-level vs. Aggregate-level

Row-Level  Aggregate-level
데이터셋의 행 단위로 계산 (세부적으로) 현재 뷰의 세부 수준에 따라 계산
Profit / Sales SUM(Profit) / SUM(Sales)
각 레코드가 ratio를 반환 모든 Profit의 합계를 구하고,
모든 Sales의 합계를 구함
 전체 Profit이 전체 Sales로 나뉨
뷰에 드래그시 집계됨.
기본값이 SUM 이기 때문에
각각의 ratio가 합계로 집계됨
뷰에 드래그시 집계되지 않음.
이미 계산식에 집계가 있기
때문에 (집계) 표시가 보임
SELECT SUM(Profit/Sales) FROM Orders SELECT SUM([Profit]) / SUM([Sales]) FROM Orders
계산결과가 정확하지 않음 계산결과 정확함

 

 

- 수익(profit)과 할인율(discount)의 상관관계 그래프 ⇒  4년간의 데이터 총 1849개의 마크

필터링 전

 

 

[Row-level]

- 매출(sales)을 합계 기준으로 필터  값의 범위를 최대 1M으로 수정

- 필터 설정 전 1849개의 마크가 필터 설정후 1800개의 마크로 줄었음  원본 row에서 매출이 1M이 넘지 않는 row를 날림

 

[Aggregate-level]

- 매출(sales)을 합계 기준으로 필터  값의 범위를 최대 1M으로 수정

- 필터 설정 전 1849개의 마크가 필터 설정후 1273개의 마크로 줄었음 사라진 576개는 특정 제품의 4년간 매출 합계가 1M을 넘지 못하는 제품들이 남은 것