일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- #패스트캠퍼스 #패스트캠퍼스부트캠프 #데이터분석 #데이터분석부트캠프 #패스트캠퍼스데이터분석부트캠프 #BDA11기 #국비지원 #패스트캠퍼스국비지원 '데이터분석 부트
- #패스트캠퍼스 #패스트캠퍼스부트캠프 #데이터분석 #데이터분석부트캠프 #BDA11기 #국비지원 #패스트캠퍼스국비지원
- #데이터분석가 #DataAnalyst #SQL #프로젝트 #취준생
- #패스트캠퍼스 #패스트캠퍼스부트캠프 #데이터분석 #데이터분석부트캠프 #패스트캠퍼스데이터분석부트캠프 #BDA11기 #국비지원 #패스트캠퍼스국비지원
- 패스트캠퍼스 #패스트캠퍼스부트캠프 #데이터분석 #데이터분석부트캠프 #BDA11기 #국비지원 #패스트캠퍼스국비지원
- Today
- Total
STUDY-LOG
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 11주차 본문
Tableau로 데이터 시각화하기2
Tableau
데이터를 탐색 및 관리하고, 인사이트를 더 빠르게 발견할 수 있는 데이터 시각화 BI
< Highlight Table >
테이블을 직관적으로 표현하는 방식인 하이라이트 테이블
- 분석 대상이 되는 차원(address)과 측정값(sales)을 선택 후 표현방식에서 '하이라이트 테이블' 클릭
(cf. Windows는 ctrl, Mac은 cmd 키 잡고 클릭)
- 또는 뷰에 드래그해서 테이블 우선 생성 후 색 입히기
- 측정값 (Sales)을 마크카드의 레이블, 색상에 드래그
- 마크카드 '사각형'으로 변경
- 열/행 총합계도 추가 가능 → 분석 패널에서 '총계'를 뷰 안으로 드래그
- 총합계를 없애고 싶으면 분석 탭 → 총계 → 체크된 항목 해제 + 모든 소계 제거
- 측정값을 여러개 지정할 수도 있음
- 추가하고 싶은 측정값을 단순히 워크시트에 끌어다 놓는다면 서로 다른 측정값 범위로 인해 이슈 발생
- 색상카드의 측정값을 우클릭 후 별도의 범례 사용을 통해 색상을 다르게 표현
- Index()를 사용한 하이라이트 테이블
- 열선반에 Order date (년, 분기), 행선반에 Order date (월) 넣기
- 행선반 더블클릭 후 INDEX() 생성 → 불연속형으로 바꿔주기
- index는 번호표를 뽑아 줄을 세우는 것과 비슷. INDEX() 우클릭 후 [테이블 계산 편집] → 특정 차원에서 '월'만 클릭
< Filter >
- 필터는 태블로의 본질과 맞닿아 있는 기능
- 다양한 스토리텔링 가능
- Order of Operations를 구성하는 핵심 요소
>> 추출 필터 (Extract Filter)
- 데이터 추출을 사용할 때만 적용 가능
- 다른 모든 필터에 앞서 적용되기 때문에 반환되는 레코드 수를 줄일 수 있음
>> 데이터 원본 필터 (Data Source Filter)
- 라이브 연결에서 사용할 수 있는 최상위 필터
- 데이터 원본 자체에 제한을 둠. 최종 사용자가 실수로 대규모 쿼리를 실행하지 못하도록 방지 및 대시보드 성능 개선
- 라이브의 필터편집에서 데이터의 일부만 가져올 수 있음
>> 차원 필터 (Dimension Filter)
- 데이터 탐색에서 가장 많이 활용되는 필터
- 원하는 데이터만 필터링을 통해 볼 수 있음
- 필터링 하고 싶은 차원을 우클릭 후 '필터표시'
>> 측정값 필터 (Measure Filter)
- 태블로의 집계방식에는 두가지가 있음 → Row-level vs. Aggregate-level
Row-Level | Aggregate-level |
데이터셋의 행 단위로 계산 (세부적으로) | 현재 뷰의 세부 수준에 따라 계산 |
Profit / Sales | SUM(Profit) / SUM(Sales) |
각 레코드가 ratio를 반환 | 모든 Profit의 합계를 구하고, 모든 Sales의 합계를 구함 → 전체 Profit이 전체 Sales로 나뉨 |
뷰에 드래그시 집계됨. 기본값이 SUM 이기 때문에 각각의 ratio가 합계로 집계됨 |
뷰에 드래그시 집계되지 않음. 이미 계산식에 집계가 있기 때문에 (집계) 표시가 보임 |
SELECT SUM(Profit/Sales) FROM Orders | SELECT SUM([Profit]) / SUM([Sales]) FROM Orders |
계산결과가 정확하지 않음 | 계산결과 정확함 |
![]() |
![]() |
- 수익(profit)과 할인율(discount)의 상관관계 그래프 ⇒ 4년간의 데이터 총 1849개의 마크
[Row-level]
- 매출(sales)을 합계 기준으로 필터 → 값의 범위를 최대 1M으로 수정
- 필터 설정 전 1849개의 마크가 필터 설정후 1800개의 마크로 줄었음 → 원본 row에서 매출이 1M이 넘지 않는 row를 날림
[Aggregate-level]
- 매출(sales)을 합계 기준으로 필터 → 값의 범위를 최대 1M으로 수정
- 필터 설정 전 1849개의 마크가 필터 설정후 1273개의 마크로 줄었음 → 사라진 576개는 특정 제품의 4년간 매출 합계가 1M을 넘지 못하는 제품들이 남은 것
'데이터분석 부트캠프 > 학습일지' 카테고리의 다른 글
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 8-10주차 (0) | 2023.12.29 |
---|---|
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 6-7주차 (0) | 2023.12.07 |
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 4주차 (0) | 2023.11.17 |
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 3주차 (0) | 2023.11.06 |
[패스트 캠퍼스] 데이터 분석 부트캠프(BDA) 11기 2주차 (1) | 2023.11.03 |