728x90
1. 데이터 이해하기
1.1 데이터에 대한 관점
- 데이터셋 관점(global)
- 개별 데이터 관점(local)
1.2 데이터셋 종류
정형 데이터
- 테이블 형태
- 일반적으로 csv(Comma Separated Value), tsv(Tab Separated Value)파일
- row는 데이터 1개(item), column은 attribute 1개(feature)
- 가장 쉽게 시각화할 수 있는 데이터셋임
- 가장 많이 접할 데이터셋이기도 함
시계열 데이터
- 시간의 흐름에 따른 Time-Series 데이터 : 추세(Trend), 계절성(Seasonality), 주기성(Cycle) 살핌
- 정형 데이터 : 기온, 주가 등 / 비정형 데이터 : 음성, 비디오 등
지리/지도 데이터
- 다양한 실사용
관계 데이터
- 객체 간 관계 시각화 (Graph visualization / Network Visualization)
- 객체는 Node로, 관계는 Link로 표현
- 크기, 색, 수 등의 시각적 요소를 통해 객체간 관계의 가중치 표현
- 휴리스틱한 노드 배치 구성 (heuristic : 러프하게 추론, 발견하는 방법)
계층적 데이터
- 포함관계가 분명한 데이터 : 네트워크 시각화로도 표현 가능
- Tree, Treemap, Sunburst 등
데이터의 종류
- 수치형(numerical) : 연속형, 이산형
- 범주형(categorical) : 명목형(순서가 중요치 않은 범주형), 순서형
2. 시각화 이해하기
2.1 마크와 채널
- 마크 : 점, 선, 면으로 이뤄진 데이터 시각화
- 채널 : 각 마크를 변경할 수 있는 요소들(색깔, 위치, 모양, 기울기, 길이, 면적 등)
2.2 전주의적 속성
pre-attentive attribute : 주의하지 않아도 인지하게 되는 요소 (동시에 여러 개 사용하면 어지러워 인지 불가. 적절히 사용할 것!)
728x90
'AI > AITech 3기' 카테고리의 다른 글
[학습 정리] 3주차 (0) | 2022.02.04 |
---|---|
[Data Viz] 1-3강 Python과 Matplotlib (0) | 2022.02.03 |
[DataViz] 1-1강 데이터 시각화란 (0) | 2022.02.03 |
[PyTorch] 10강 PyTorch Troubleshooting (2) | 2022.01.28 |
[PyTorch] 9강 Hyperparameter Tuning (2) | 2022.01.27 |