[Data Viz] 1-2강 시각화의 요소

지구인 ㅣ 2022. 2. 3. 18:15

728x90

1. 데이터 이해하기


1.1 데이터에 대한 관점

  • 데이터셋 관점(global)
  • 개별 데이터 관점(local)

 

1.2 데이터셋 종류

정형 데이터

  • 테이블 형태
  • 일반적으로 csv(Comma Separated Value), tsv(Tab Separated Value)파일
  • row는 데이터 1개(item), column은 attribute 1개(feature)
  • 가장 쉽게 시각화할 수 있는 데이터셋임
  • 가장 많이 접할 데이터셋이기도 함

시계열 데이터

  • 시간의 흐름에 따른 Time-Series 데이터 : 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 살핌
  • 정형 데이터 : 기온, 주가 등 / 비정형 데이터 : 음성, 비디오 등

지리/지도 데이터

  • 다양한 실사용

관계 데이터

  • 객체 간 관계 시각화 (Graph visualization / Network Visualization)
  • 객체는 Node로, 관계는 Link로 표현
  • 크기, 색, 수 등의 시각적 요소를 통해 객체간 관계의 가중치 표현
  • 휴리스틱한 노드 배치 구성 (heuristic : 러프하게 추론, 발견하는 방법)

계층적 데이터

  • 포함관계가 분명한 데이터 : 네트워크 시각화로도 표현 가능
  • Tree, Treemap, Sunburst 등

데이터의 종류

  • 수치형(numerical) : 연속형, 이산형
  • 범주형(categorical) : 명목형(순서가 중요치 않은 범주형), 순서형

 

2. 시각화 이해하기


2.1 마크와 채널

  • 마크 : 점, 선, 면으로 이뤄진 데이터 시각화
  • 채널 : 각 마크를 변경할 수 있는 요소들(색깔, 위치, 모양, 기울기, 길이, 면적 등)

2.2 전주의적 속성

pre-attentive attribute : 주의하지 않아도 인지하게 되는 요소 (동시에 여러 개 사용하면 어지러워 인지 불가. 적절히 사용할 것!)

 

 

728x90

'AI > AITech 3기' 카테고리의 다른 글

[학습 정리] 3주차  (0) 2022.02.04
[Data Viz] 1-3강 Python과 Matplotlib  (0) 2022.02.03
[DataViz] 1-1강 데이터 시각화란  (0) 2022.02.03
[PyTorch] 10강 PyTorch Troubleshooting  (2) 2022.01.28
[PyTorch] 9강 Hyperparameter Tuning  (2) 2022.01.27