필터
필터는 데이터를 원하는 조건에 맞게 걸러주는 역할을 한다. 필터에는 여러 가지의 기능을 가진 다양한 필터가 있고,
작동 순서가 정해져 있어 어떤 필터를 먼저 사용하는지에 따라 결과물이 다르게 나타난다.
<필터 작동 순서>
1. 추출 필터
추출 필터는 데이터 원본 소스에서 데이터의 일부분만 추출하고 싶을 때 사용하는 필터다. 태블로 [데이터 원본] 창에서 [추출]을 누르고 옆에 [편집]을 클릭해 원하는대로 추출할 데이터를 편집한 후 저장한다.
2. 데이터 원본 필터
데이터 원본 필터는 원본에서 원하는 부분만 볼 때 사용하는 필터다. 원본 자체를 건들이는 방식이라 따로 데이터 저장은 하지 않는다. 사용하는 방법은 [데이터 원본 창]의 필터 밑 [추가] 버튼을 클릭하여 데이터를 추출하면 된다.
3. 차원 필터
차원 필터는 데이터 유형 중 차원을 필터링하는 필터다.
차원 형태의 데이터를 사진 상에 표시해놓은 곳에 올려두면 원하는 데이터만 추출해서 시각화 할 수 있다.
또한, 필터 표시를 이용해서 단일 값 혹은 다중 값을 살필 수 있는 형태로도 만들 수 있다.
4. 측정값 필터
측정값 필터는 데이터 유형 중 측정값을 필터링하는 필터다. 차원 필터와 마찬가지로 시트 상의 필터에 측정값의 형태로 된 데이터를 올려주면 된다.
5. 컨텍스트 필터
작동 순서에서 가장 앞의 우선 순위를 갖고 있는 필터이며, 데이터 원본 전체를 대상으로 가장 먼저 필터링 한다.
필터가 너무 많거나 데이터 원본이 큰 경우, 상위 N 필터를 적용해야하는 경우에 사용한다.
자세한 필터 적용 실습은 밑에 따로 첨부해두었다.
계산된 필드
1. 기본 계산
<집계 계산 함수>
*exp는 expression의 약자다. / 출처 : https://help.tableau.com/current/pro/desktop/ko-kr/calculations_calculatedfields_aggregate_create.htm
함수명 | 반환값 |
AVG( exp ) | exp 값들의 평균 |
STDEV( exp ) | exp 값들의 표본표준편차 |
SUM( exp ) | exp 값들의 합계 |
VAR( exp ) | exp 값들의 표본분산 |
COUNT( exp ) | exp 값들의 항목 수 |
COUNTD( exp ) | exp 값들의 고유 항목 수를 반환 |
MIN( exp ) | exp 값들의 최소값 |
MEDIAN( exp ) | exp 값들의 중앙값 |
MAX( exp ) | exp 값들의 최대값 |
PERCENTILE( exp , num ) | exp 값들의 num에 해당하는 백분위수 ( 0 ≤ num ≤ 1) |
CORR( exp1, exp2 ) | exp1과 exp2 값들의 표본상관계수 |
COVAR( exp1, exp2 ) | exp1과 exp2 값들의 표본공분산 |
ATTR( exp ) | exp의 모든 행에 대해 단일 값이 있으면 식의 값을 반환, 그렇지 않으면 별표를 반환, Null 값은 무시 |
2. 테이블 계산
<테이블 계산 함수>
함수명 | 반환값 |
INDEX( ) | 현재 행의 인덱스 반환 |
FIRST( ) | 현재 행으로부터 첫 번째 행까지 남은 행 개수 반환 |
LAST( ) | 현재 행으로부터 마지막 행까지 남은 행 개수 반환 |
LOOKUP(exp, [offset]) | 현재 행의 기준 위치로 지정된 대상 행에서 식의 값을 반환 |
PREVIOUS_VALUE( exp ) | 이전 행의 값을 반환, 현재 행이 첫번째 행인 경우 0 반환 |
RANK( exp, ['asc' | 'desc'] ) | 집계된 필드의 순위를 반환한다. (asc : 오름 / desc : 내림) |
RANK_DENSE( exp, ['asc' | 'desc'] ) | RANK 함수에서 공동 순위 설정 O |
RANK_UNIQUE( exp, ['asc' | 'desc'] ) | RANK 함수에서 공동 순위 설정 X |
RUNNING_SUM( exp ) | 누적 합계 |
RUNNING_AVG( exp ) | 누적 평균 |
RUNNING_MAX( exp ) | 누적된 값들 중 최대값 |
RUNNING_MIN( exp ) | 누적된 값들 중 최소값 |
WINDOW_SUM( exp, [start, end] ) | 파티션에 있는 식의 합계 |
WINDOW_VAR( exp, [start, end] ) | 파티션에 있는 식의 표본분산 |
WINDOW_AVG( exp, [start, end] ) | 파티션에 있는 식의 평균 |
* 집계 계산 함수 앞에 WINDOW를 붙이면 모두 사용 가능하고, 지정하는 시작 위치와 끝 위치는 0에서부터 시작되는 점을 유의한다.
3. LOD 계산
LOD : Level of Detail
만들 수 있는 LOD 식에는 3가지가 존재한다.
① {FIXED [차원]: 집계값} : 특정 차원을 사용하여 계산, INCLUDE와 EXCLUDE의 기능을 둘 다 수행할 수 있음. 특히, 날짜 필드를 사용할 때 유용하다. (특정 날짜 필드 고정 용도) 또한, 필터의 영향을 받지 않는 값을 만들어야할 때 유용하다.
예시 : 지역별 매출 합계 -- {FIXED [Region] : SUM([Sales])}
② {INCLUDE [차원] : 집계값} : 특정 차원을 추가하여 계산
예시 : 고객별 총 매출 -- { INCLUDE [Customer Name] : SUM([Sales]) }
③ {EXCLUDE [차원] : 집계값} : 특정 차원을 제외하여 계산
예시 : 월별 평균 매출 합계를 계산한 다음 월 구성 요소를 제외
-- {EXCLUDE [Order Date (Month / Year)] : AVG({FIXED [Order Date (Month / Year)] : SUM([Sales])})}
참고 : https://help.tableau.com/current/pro/desktop/ko-kr/calculations_calculatedfields_lod.htm#lod-%EC%8B%9D%EC%9D%98-%EC%9C%A0%ED%98%95
https://blog.naver.com/ham3883/222978196068
https://www.youtube.com/@vizlab_kr/videos
매개 변수
: 계산, 필터 또는 참조선에서 상수 값으로 대체할 수 있는 숫자, 날짜, 또는 문자열과 같은 통합 문서 변수
매개 변수에서 값을 허용하는 방식 3가지
1. 모두 허용 : 매개 변수 컨트롤이 간단한 텍스트 필드
2. 목록형 : 매개 변수 컨트롤이 선택할 수 있는 값의 목록을 제공
3. 범위형 : 매개 변수 컨트롤을 사용하여 지정한 범위 내의 값을 선택
참고 : https://help.tableau.com/current/pro/desktop/ko-kr/parameters_create.htm
실습
'tableau' 카테고리의 다른 글
[tableau] Sankey Diagram (1) | 2024.01.31 |
---|---|
[tableau] 두산베어스 구단 분석 대시보드 (0) | 2023.07.03 |
[tableau] 전국 병의원 및 약국 현황 대시보드 (0) | 2023.03.10 |
[tableau] KBO pitching, batting 데이터로 대시보드 제작하기 (0) | 2023.02.03 |
[tableau] 그래프 만들기 (0) | 2023.01.24 |
댓글