2025.05.31 - [프로그래밍/데이터 시각화] - [Tableau] Table of Contents
새로 만들어진 카테고리 데이터 시각화의 첫 포스팅은 Tableau 시리즈입니다. 일단 오늘은 Tableau의 기본 개념과 용어에 대해서 알아보겠습니다. 일단 본격적으로 들어가기에 앞서 Tableau라는 것이 시각화라는 결과물을 위해서 무조건 '집계'해서 보여준다는 것이 큰 특징이자 장점이라는 것을 강조해드리고 싶습니다. 이 부분은 이어지는 포스팅들에서 제가 말씀드리도록 하겠습니다.
1. 차원과 측정값
측정값(Measure) : 태블로의 축 위에 올려놓고 이것저것 가공해서 시각화하는 재료, 다시 말해 '대상'이라고 보시면 되겠습니다.
차원(Dimension) : 측정값이라는 대상을 어떤 수준(level)에서 집계할 것이가를 결정하는 요소입니다. 예를 들어 인구를 시각화한다고 할 때, 동 레벨에서 집계를 할 것인지, 구 레벨에서 집계를 할 것인지 도 레벨에서 집계할 것인지 결정해야 합니다. 참고로 보통 (연속형 측정값의) default 집계 옵션은 합계입니다.
아래 예시에서는 sales 데이터를 간단히 시각화하고 있는데요, 행 축에는 시간(월)을 열 축에는 영업이익(profit)을 두고 히스토그램으로 시각화했습니다. 이 때 profit이 measure가 되고 시간(월)이 차원이 됩니다. 보시는 것처럼 차원을 월로 두느냐 연으로 두느냐 분기로 두느냐에 따라 집계 레벨이 달라지고 눈으로 확인할 수 있는 결과물도 달라집니다.
이처럼 차원과 측정값 중 오직 차원만이 화면의 level of detail(지금 예시에서는 월, 분기, 연..에 해당하는)을 결정하게 됩니다. 기본적으로 시각화해주는 Level을 어느 수준까지 설정하느냐는 지금보시는 것처럼 선반에 올려두는 변수에 따라 결정됩니다. 그런데 가끔은 내가 선반에 올려놓는 변수의 레벨이 아닌 더 상위 혹은 하위 레벨에서의 집계가 필요한 경우도 있겠지요? 태블로가 버전업되면서 이런 기능도 쉽게 구현할 수 있는 기능이 업데이트 되었습니다. View level of detail expression인 fixed, include, exclude인데 이 기능들은 나중에 다시 따로 포스팅하겠습니다. 지금은 그냥 기본적으로 선반에 올려놓는 변수의 레벨에 맞추어 시각화의 레벨도 설정되는데 그게 싫으면 추가 기능을 이용해서 계산을 수행해주면 된다고만 기억해두시면 됩니다.
2. 필터 (filter)
우리가 시각화해서 보여줄 때 (행이든 열이든) 특정 카테고리나 범위를 배제하고 보여주고 싶을 수가 있겠죠? 이럴때는 필터를 사용하면 됩니다.
3. 매개변수 (parameter)
사실 매개변수는 그 자체로는 대시보드에 영향을 주지 못합니다. 다만 계산식에서 말 그대로 중간 매개역할을 하는 변수를 말합니다. 예를들어 위의 sales예시에서 notebook과 tablet을 묶어서 'computer'라는 카테고리만을 만들어 보고싶다면 notebook과 tablet일 때는 'com'을 그외의 카테고리일 때는 'other'라는 값을 갖는 매개변수를 만들고 그 매개변수를 활용한 계산된 필드를 만드는겁니다(매개변수가 com일 때는 proft의 값을 그게 아닐 때는 0을 반환하는 값을 만들면 되겠죠?). 그리고 매개변수를 바꿔가며 설정하면 우리가 원하는 결과물을 얻을 수 있겠죠.
아래 예시에서는 East와 West를 묶어서 Eastwest매개변수를 만들었습니다. 매개변수 필터에서 매개변수를 EastWest로 두면 [ 'Eastwest일때만profit' ]계산된필드가 profit값이 되고, 매개변수를 Other로 두면 [ 'Eastwest일때만profit' ] 가 0이 나오는 것을 확인할 수 있습니다(여기서 과거의 저와 같이 궁금한 점이 생기신 분도 있을 수 있습니다. 아까 region 필터를 만들어서 East와 West만 체크하면 되지않나 하실수도요. 맞습니다. 사실 여기서의 예제만 보면 차이가 없는데, 필터를 쓰는것과 매개변수를 쓰는 것에는 조금 차이가 있습니다. 필터는 지금 sheet 전체에 해당 카테고리를 filtering 하거든요. 이 차이도 추후에 포스팅 하는 것으로 하겠습니다). 지금은 계산된 필드 안에서 매개변수가 활용되는 방법을 보여드렸는데 이와 같이 매개변수는 계산된필드(Calculated Field), 필터(Filter), 집합(Set), 구간차원(Bin), 참조선(Reference Line)/참조구간(Reference Band), 커스텀 SQl 중 한 곳에 Embed되어 사용됩니다.
'프로그래밍 > 데이터 시각화' 카테고리의 다른 글
[Tableau] Table of Contents (0) | 2025.05.31 |
---|---|
[Tableau 기초] 변수의 Distribution(Histogram) 그리기 (0) | 2025.01.13 |
[Tableau] Level of Detail Calculation (1) | 2024.12.15 |
[Tableau] 테이블 계산 (Table Calculation) (0) | 2024.12.02 |
[Tableau] Order of Operation (0) | 2024.12.01 |