MinAI - Về trang chủ
Hướng dẫn
1/1330 phút
Đang tải...

Data Visualization Fundamentals

Nguyên tắc thiết kế visualization hiệu quả - Chart selection, Color theory, và Storytelling với data

0

🎯 Mục tiêu bài học

TB5 min

Sau bài học này, bạn sẽ:

✅ Hiểu tại sao visualization quan trọng hơn raw numbers

✅ Nắm framework chọn chart phù hợp cho từng mục đích

✅ Áp dụng Color Theory: categorical, sequential, diverging

✅ Thiết kế theo Gestalt Principles và Data-Ink Ratio

✅ Storytelling với data: Setup → Conflict → Resolution

Thời gian: 30 phút | Độ khó: Beginner | Yêu cầu: Không cần kiến thức trước

1

📖 Bảng Thuật Ngữ Quan Trọng

TB5 min
Thuật ngữTiếng ViệtMô tả
Anscombe's QuartetBộ tứ Anscombe4 datasets cùng statistics, khác visual
Cognitive LoadTải nhận thứcGánh nặng xử lý thông tin của não
Data-Ink RatioTỷ lệ mực-dữ liệuTối đa data, tối thiểu decoration
Gestalt PrinciplesNguyên tắc GestaltProximity, Similarity, Enclosure
Pre-attentive AttributesThuộc tính tiền chú ýColor, position, size — não xử lý tức thì
Sequential PaletteBảng màu tuần tựLight → Dark cho values thấp → cao
Diverging PaletteBảng màu phân kỳRed ← Gray → Green cho positive/negative
Categorical PaletteBảng màu phân loạiDistinct colors cho categories
Visual HierarchyPhân cấp thị giácImportant → Large, top; Less → Small, bottom
Data StorytellingKể chuyện bằng dataSetup → Conflict → Resolution

Checkpoint

Data-Ink Ratio = tối đa data, tối thiểu ink. Pre-attentive Attributes = não xử lý tức thì (color, position). 3 loại palette: categorical (phân loại), sequential (tuần tự), diverging (phân kỳ). Bạn phân biệt được chưa?

2

💡 1. Tại Sao Visualization Quan Trọng?

TB5 min

1.1 Con số vs Hình ảnh

Ví dụ
1Raw data:
2Q1: 150, Q2: 180, Q3: 210, Q4: 195
3
4Observation từ số: "Q3 cao nhất"
5
6Observation từ chart:
7- Q3 cao nhất
8- Uptrend Q1→Q3
9- Q4 giảm nhẹ (potential concern)
10- Growth rate giảm dần

1.2 Anscombe's Quartet

4 datasets có cùng thống kê (mean, variance, correlation) nhưng hoàn toàn khác khi visualize.

Ví dụ
1Dataset 1: Linear relationship
2Dataset 2: Quadratic relationship
3Dataset 3: Perfect line + 1 outlier
4Dataset 4: Vertical line + 1 outlier
5
6Statistics: Identical → Visualization: Completely different!

Lesson: Luôn visualize data, không chỉ dựa vào statistics.

1.3 Cognitive Load

Visualization giúp:

  • ✅ Pattern recognition nhanh
  • ✅ Outlier detection dễ dàng
  • ✅ Comparison trực quan
  • ✅ Trend identification rõ ràng

Anscombe's Quartet là ví dụ kinh điển: 4 datasets cùng mean, variance, correlation — nhưng khi vẽ chart thì hoàn toàn khác nhau. Luôn visualize trước khi kết luận!

Checkpoint

Visualization quan trọng vì não xử lý hình ảnh nhanh hơn 60,000x so với text. Anscombe's Quartet chứng minh: statistics giống nhau ≠ patterns giống nhau. Bạn đã bị mislead bởi numbers chưa?

3

📊 2. Chọn Chart Phù Hợp

TB5 min

2.1 Decision Framework

🤔Bạn muốn show gì?
📊Comparison → Bar/Column Chart
📈Trend over time → Line Chart
🥧Part-to-whole → Pie/Donut (≤5 parts)
📉Distribution → Histogram/Box Plot
🔵Relationship → Scatter Plot
📚Composition → Stacked Bar/Area

2.2 Chart Selection Guide

PurposeBest ChartsAvoid
Compare categoriesBar, ColumnPie (nhiều categories)
Show trendLine, AreaPie, Bar
Part of wholePie (≤5), Treemap, StackedLine
DistributionHistogram, Box, ViolinBar
CorrelationScatter, BubbleLine, Bar
GeographicMap, ChoroplethBar

2.3 Common Mistakes

❌ Pie chart cho 15 slices → Dùng horizontal bar chart

❌ 3D charts → Luôn dùng 2D

❌ Dual-axis abuse → Separate charts hoặc normalize

❌ Truncated Y-axis → Bắt đầu từ 0 hoặc clearly labeled

Wrong chart = Wrong message. Pie chart cho 12 categories → không ai đọc được. Truncated Y-axis → small change trông như crisis. Luôn hỏi: "Chart này có gây hiểu lầm không?"

Checkpoint

Chart selection framework: Comparison → Bar, Trend → Line, Part-to-whole → Pie (≤5), Distribution → Histogram, Correlation → Scatter. Luôn match purpose với chart type!

4

🎨 3. Color Theory for Data

TB5 min

3.1 Color Purposes

PurposeColor TypeExample
CategoricalDistinct colorsProducts: Blue, Red, Green
SequentialLight to darkRevenue: Light blue → Dark blue
DivergingTwo-directionalProfit/Loss: Red ← Gray → Green
HighlightAccent colorOne bar highlighted in orange

3.2 Best Practices

Ví dụ
1✅ Limit to 5-7 colors max
2✅ Use colorblind-friendly palettes
3✅ Consistent colors across dashboard
4✅ Gray for context, color for focus
5
6❌ Rainbow colors (hard to distinguish)
7❌ Red = Good, Green = Bad (reverse!)
8❌ Same color, different meanings
9❌ Bright colors for background

3.3 Accessible Color Palettes

Ví dụ
1Colorblind-safe:
2#1f77b4 (Blue) #ff7f0e (Orange) #2ca02c (Green)
3#d62728 (Red) #9467bd (Purple) #8c564b (Brown)
4
5Sequential: #deebf7 → #9ecae1 → #3182bd → #08519c
6Diverging: #d7191c → #fdae61 → #ffffbf → #a6d96a → #1a9641

Gray là color quan trọng nhất! Dùng gray cho context data, color cho focus data. Khi chỉ 1 bar được highlight → message rõ ràng ngay lập tức.

Checkpoint

3 loại palette: Categorical (distinct), Sequential (light→dark), Diverging (red←gray→green). Max 5-7 colors, consistent meaning, colorblind-safe. Gray = context, color = focus!

5

📐 4. Design Principles

TB5 min

4.1 Data-Ink Ratio

Maximize data, minimize non-data ink. Bỏ gridlines nặng, 3D effects, decorative elements.

4.2 Gestalt Principles

Proximity: Nhóm related items gần nhau

Similarity: Same color/shape = Same category

Enclosure: Border groups related info

4.3 Visual Hierarchy

Ví dụ
1Most Important → Large, bold, top position
2Supporting → Medium, prominent
3Detail → Smaller, bottom

Checkpoint

Data-Ink Ratio = remove chart junk. Gestalt: Proximity (nhóm gần), Similarity (cùng format), Enclosure (border group). Visual Hierarchy = important → large + top. Bạn đã áp dụng chưa?

6

📝 5. Data Storytelling

TB5 min

5.1 Story Structure

Ví dụ
11. SETUP (Context): "Q3 revenue was $2.5M..."
22. CONFLICT (Problem): "...but growth slowed to 5% vs 15% Q2"
33. RESOLUTION (Action): "Marketing spend dropped 20%
4 → Recommend: Increase budget $50K"

5.2 Annotation Techniques

  • Callouts: Highlight specific points
  • Reference lines: Targets, averages
  • Trend lines: Show direction
  • Notes: Context, caveats

5.3 Dashboard Flow

Dashboard Flow Layout
Vị tríNội dungVai trò
TopTITLE + Key insight in subtitleOverview
Row 1KPI 1 · KPI 2 · KPI 3At-a-glance
CenterMAIN VISUALIZATIONCore story
BottomSupporting Chart 1 · Supporting Chart 2Details

Mọi dashboard đều kể một câu chuyện. KPIs ở trên = "What happened", main chart ở giữa = "Why", supporting charts = "Details". Flow từ trên xuống = từ overview đến detail.

Checkpoint

Data Storytelling: Setup (context) → Conflict (problem) → Resolution (action). Annotations highlight key insights. Dashboard flow: KPIs → Main Chart → Detail Charts. Bạn đã kể chuyện bằng data chưa?

7

👁️ 6. Pre-attentive Attributes

TB5 min

Attributes Brain Processes Instantly

AttributeBest For
PositionComparing values
LengthQuantities
Color hueCategories
Color intensityMagnitude
SizeRelative amounts
OrientationDirection
Ví dụ
1Make important data POP:
2
3Before: ■ ■ ■ ■ ■ ■ ■ ■ (all same)
4After: ■ ■ ■ ■ █ ■ ■ ■ (target highlighted)
5
6 "This one!"

Checkpoint

Pre-attentive attributes: Position, Length, Color, Size — não xử lý trong < 0.5 giây. Dùng để make important data POP — highlight bằng color hoặc size khác biệt!

8

🏋️ 7. Thực hành

TB5 min
Thực hành

Critique dashboard và chọn chart --- kỹ năng quan trọng nhất!

Exercise 1: Critique This Dashboard

Ví dụ
1- 3D Pie Chart with 12 slices
2- Rainbow colors
3- Legend far from chart
4- No title
5- Y-axis starts at 1000
6- Dual axis with different scales
7
8→ List 6 problems and suggest fixes.

Exercise 2: Choose the Right Chart

  1. "Compare revenue across 10 regions" → ?
  2. "Show how market share changed over 5 years" → ?
  3. "Display correlation between ad spend and sales" → ?
  4. "Break down expenses by category" → ?
  5. "Show distribution of customer ages" → ?
9

📋 8. Tổng kết

TB5 min

Kiến thức đã học

Chủ đềNội dung chínhTầm quan trọng
Why VisualizationAnscombe's Quartet, cognitive loadFoundation
Chart SelectionFramework: purpose → chart typeCore skill
Color TheoryCategorical, sequential, divergingVisual clarity
Design PrinciplesData-Ink Ratio, Gestalt, hierarchyProfessional quality
Data StorytellingSetup → Conflict → ResolutionCommunication
Pre-attentivePosition, length, color, sizeBrain science

Câu hỏi tự kiểm tra

  1. Anscombe’s Quartet chứng minh điều gì về data visualization?
  2. Pre-attentive attributes nào hiệu quả nhất cho so sánh?
  3. Data-Ink Ratio là gì?
  4. Data Storytelling gồm những bước nào?

Bài tiếp theo: Tableau Fundamentals — Bắt đầu với Tableau Desktop và tạo visualization đầu tiên!

🎉 Tuyệt vời! Bạn đã nắm vững nền tảng Data Visualization!

Nhớ: Chart tốt không cần giải thích — người xem tự hiểu insight ngay lập tức!