본문 바로가기

IT

[Tableau] 데이터 원본 만들기

반응형

Tableau 차트를 만들기에 앞서 어떤 데이터를 사용 할 지 정하게 되는데, 일반 회사에서는 Excel,  DB 등을 많이 사용할 것입니다.

데이터 종류를 선택하고 난 다음 작업은 데이터 원본 만들기이며, 어떤 테이블을 사용할 것인지 또는 어떻게 데이터를 가공할 것인지 등 차트를 효율적으로 만들기 위한 사전 작업이라고 생각하시면 될 것 같습니다.

 

데이터 연결 같은 경우에는 이전에 포스팅한 데이터 구조 및 데이터 연결 내용을 확인해 주시면 됩니다.

https://lee91.tistory.com/21

 

[Tableau] 데이터 구조 및 데이터 연결

Tableau Desktop을 사용하여 데이터 시각화를 만든다면 사전에 데이터가 준비되어야 합니다. 대부분 Excel이나 DB에서 데이터를 사용하는데, Tableau에 맞는 데이터 구조로 맞춰 준 다음에 데이터를 사

lee91.tistory.com

 

이번 포스팅은 위의 링크에서 이어서 하는 내용으로 데이터 연결 후 데이터 원본에서는 어떻게 작업을 하는지를 설명드리겠습니다.

 

#1 Tableau 데이터 원본 만들기

Tableau Desktop 실행 후 맨 처음 화면으로는 데이터 종류를 선택하는 화면이 나오는데, 데이터 종류를 선택하면 자동으로 아래 화면과 같이 데이터 사전 작업을 할 수 있는 화면이 나옵니다.

 

Tabelau 샘플 데이터 선택 시 데이터 원본 작업 화면

 

기본적으로 데이터 테이블을 하나만 사용한다고 하면, 좌측 사이드 바 쪽에서 시트라는 부분의 리스트 중 필요한 테이블을 더블클릭 또는 Drag & Drop으로 "여기로 테이블 끌기" 공간에 배치합니다.

 

데이터 원본 기본 생성 1

 

정상적으로 데이터를 불러왔다면 "여기로 테이블 끌기" 공간에 불러온 데이터가 생성이 됩니다.

불러온 데이터는 하단에 샘플로 데이터에 대한 필드 정보, 적재된 데이터 내용(최소 100 행) 등이 표시되어 확인 할 수 있습니다.

 

데이터 원본 기본 생성 2

 

데이터 내용까지 확인을 했다면, 좌측 하단에 "시트 1" 이라는 주황색 부분의 버튼을 클릭하여 차트를 만드는 공간인 워크시트로 이동합니다.

 

데이터 원본 기본 생성 3

워크시트로 넘어가면, 기본적인 데이터 원본 생성 작업은 끝이고, 차트를 만드는 작업을 시작하면 됩니다.

 

데이터 원본 기본 생성 4

 

#2 Tableau Data Join

데이터 작업을 하다 보면 여러가지 테이블을 하나로 합쳐서 봐야 하는 경우도 생길 것입니다.

이 때 사용하는 데이터 작업을 Join 이라고 하며, 일반적으로 DB에서 많이 사용하는 작업이며, DB와 비슷하게 쿼리로 만들 수 있지만 간단하게 다이어그램으로도 생성 할 수 있습니다.

 

Join을 할 때 두 테이블은 공통 관계 필드가 있어야 합니다.

예를 들어 주문 테이블에 주문 ID가 있고 반품 테이블에 주문 ID가 공통적으로 존재할 경우 서로 일치한 ID만 가지고 하나의 테이블을 구성 할 수 있습니다.

이를 Key라고 부릅니다.

 

Join 하는 방법은 이전에 설명 드린거처럼 먼저 하나의 테이블을 데이터 작업 공간에 배치합니다.

그리고 배치해둔 테이블을 더블클릭하게 되면 기존에 있던 주문 테이블이 Join 할 수 있는 작업공간으로 변경이 됩니다.

Join 하는 방법 1

Join 할 수 있는 작업 공간으로 변경시키고, 추가할 테이블을 더블클릭 또는 작업 공간에 Drag & Drop 하여 Join 형태로 만들어줍니다.

 

Join 하는 방법 2

 

기본적으로 Inner Join이라는 형태로 구성되어 있으며, 가운데 다이어그램 모양을 클릭하면 다른 Join 형태나 Key 설정을 할 수 있습니다.

 

Join 하는 방법 3

모든 Join 작업이 완료가 되면 좌측 하단에 시트 1을 클릭하여 워크시트로 이동합니다.

 

Join 하는 방법 4

Join 유형에는 총 4가지가 있으며, Join에 대한 내용은 다음 포스팅 때 하도록 하겠습니다. ㅎㅎㅎ

 

#3 Tableau 데이터 연결 유형

데이터 작업을 하다 보면 데이터를 실시간으로 볼건지 아니면 매일, 매월 등의 기간을 두고 추출해서 볼건지 등에 대한 기간적인 고민을 하게 됩니다.

 

Tableau에서는 데이터 원본 작업 화면의 우측 상단 연결이라는 부분에서 작업을 할 수 있습니다.

정확하게는 해당 연결 유형 선택 후 Tableau Server에 게시를 하게 되면 스케줄링을 통해 실시간 또는 기간 설정한 추출 작업을 서버에 시켜 자동화를 할 수있게 됩니다.

 

#3-1 라이브

라이브 유형의 데이터 원본

라이브는 말 그대로 작업 공간에 올라가져 있는 데이터를 라이브 즉, 실시간으로 볼 수 있게끔 합니다.

데이터가 적은 경우에는 조회하는 속도가 빠르기 때문에 차트를 만들거나 대시보드 조회하는 속도에서는 문제없이 실시간으로 확인 할 수 있습니다.

하지만, 데이터가 많거나 Join이 복잡 또는 만들어진 차트들이 많이 있다면 화면 보는데에 불편함을 느낄 수 있습니다.

 

#3-2 추출

추출 유형의 데이터 원본

추출은 라이브와 다른 형태로 Hyper라는 Tableau 만의 추출 형식 파일을 따로 생성하여 해당 추출 파일을 가지고 데이터를 조회하게 됩니다.

 

추출 선택 후 워크시트 이동 시 Hyper 파일 저장 필요

추출 선택 시 Hyper 형식의 파일을 저장해야 하며 저장 이후 작업공간에 올려둔 데이터를 바라보는 것이 아니라 저장된 Hyper 파일을 바라보게 됩니다.

 

DB 또는 Excel에 추출할 때 한번만 접근하기 때문에 데이터 운영관리에 있어서는 부담이 덜 합니다.

또한 추출 파일로 데이터를 작업하기 때문에 라이브보다 속도가 빠른 것을 확인 할 수 있습니다.

다만, 실시간으로 봐야되는 경우에는 물리적인 추출 시간이 있다보니 추출 작업 시간을 조정하거나 또는 추출 간격을 한달에 한번 등 시간적인 부분을 정해야 하는 경우가 생깁니다.

 

 

데이터 원본 작업은 이렇게 테이블 선택 / 데이터 구조 / 연결 유형 등 여러가지를 고려해야 할 사항이 있으며, 차트 만드는 것도 중요하지만, 정확하고 효율적으로 데이터를 가공하는 것이 제일 먼저이지 않을까 싶습니다.

반응형

'IT' 카테고리의 다른 글

[Tableau] 막대 차트 만들기  (2) 2022.12.26
[Tableau] Join  (0) 2022.12.23
[Tableau] 데이터 구조 및 데이터 연결  (0) 2022.01.07
[Tableau] Tableau Desktop 다운로드 및 제품키 활성화  (0) 2022.01.03
[Tableau] Tableau 소개  (0) 2021.12.29