배우기/데이터시각화&BI

[Tableau] 조인(Join) vs 블렌딩(Blending) vs 관계(Relation)

수이 Sui 2023. 4. 16. 21:55

입사후 약 9개월간 진행한 첫 번째 프로젝트에서는 데이터 시각화 툴로 루커 스튜디오를 사용했는데,

프로젝트가 종료된 현재, 태블로나 파워BI를 사용하는 BI 프로젝트에 새롭게 배치될 예정이라 학습하는 기간을 갖고 있다.

태블로는 데이터 소스를 준비하는 방법이 다양하여 학습한 내용을 정리해두고자 한다.


태블로에서 데이터를 준비하는 방법은 세 가지로, 조인, 블렌딩, 관계가 있다.

 

조인 (Join)

테이블을 물리적으로 결합하는 방법. 관계형 데이터베이스에서의 조인과 같은 역할이라고 생각하면 쉽다.

 

・유의점

- 조인은 분석을 시작하기 전에 설정되어야 한다.

- 테이블이 서로 다른 세부 수준에 있는 경우, 데이터 손실이나 중복이 발생할 수 있다.

- 조인은 게시된 데이터 원본을 사용할 수 없다.

   따라서, 로컬에 게시된 데이터 원본의 복사본을 작성하여 조인하거나, 게시된 데이터의 원본을 사용하려면 조인 대신 혼합을 사용해야 한다.

 

조인이 설정된 모습

블렌딩 혹은 혼합 (Blending)

블렌딩은 관계나 조인과 달리 데이터를 직접 결합하지 않는다.

대신, 각 데이터 원본에 독립적으로 쿼리를 보내고, Visualization의 입도에 맞추어 결과를 집계한 뒤 표시하게 된다.

따라서, 혼합은 서로 다른 세부 수준을 처리할 수 있으며, 게시된 데이터 원본에서도 작동한다.

 

・유의점

- 혼합은 단순히 시트별로 시각화된 결과가 혼합된 것이기 때문에, 새로 혼합된 원본을 만들지 않고서는 혼합된 데이터 원본을 게시할 수 없다.

- 데이터 소스의 파일 형식이 다른 경우 혼합을 사용해야 한다.

- 무조건 left join으로 결합된다. 따라서 프라이머리 테이블에는 가능한 모든 값들이 포함되어야 한다.

- 태블로가 측정 기준명을 보고 자동으로 연결해주지만, 수동으로 측정 기준을 추가하거나 동일한 측정 기준명으로 변경해주어야 하는 경우도 있다.

 

▼ 프라이머리 데이터 소스는 파란색으로, 세컨더리 데이터 소스는 주황색으로 표시된다.

혼합이 설정된 모습

▼ 혼합은 left join으로 결합되기 때문에,

Airline2에는 Region필드에 North America, South America라는 값이 없으므로,

Airline2를 프라이머리 데이터 소스로 설정한 경우, Airline1의 North America, South America는 손실된다.

혼합 결과

관계 (Relation) v.2020.2 update

분석을 위해 여러 테이블의 데이터를 결합하는 경우에 사용되며, 동적이고 유연하다.

테이블을 병합하지 않지만, 공통 필드를 기반으로 두 테이블이 어떻게 관련되어 있는지 설명하는 방법이다.

테이블간의 관계가 생성되어도, 테이블은 분리되어 있으며 각각의 세부 수준과 도메인은 유지된다. 

세부 수준이 다른 테이블 간을 비롯한 대부분의 경우에 사용할 수 있다.

조인된 테이블을 이용하여 관계 설정 또한 가능하다.

 

 

・유의점

- 게시된 데이터 원본의 테이블 관계는 설정이 불가하다.

테이블간의 관계가 설정된 모습