MinAI - Về trang chủ
Hướng dẫn
8/1345 phút
Đang tải...

Power Query Basics

Import, clean, và transform data tự động với Power Query Editor

0

🎯 Mục tiêu bài học

TB5 min

Sau bài học này, bạn sẽ:

✅ Hiểu Power Query Editor interface và workflow

✅ Import data từ CSV, Excel, Web, Folder

✅ Thực hiện Basic Transforms: filter, sort, remove, replace

✅ Áp dụng Column Transforms: split, merge, extract, format

✅ Sử dụng Date Transformations và Refresh data

Thời gian: 45 phút | Độ khó: Intermediate-Advanced | Yêu cầu: Hoàn thành Bài 7 - Named Ranges & Tables

1

📖 Bảng Thuật Ngữ Quan Trọng

TB5 min
Thuật ngữTiếng ViệtMô tả
Power QueryTruy vấn nguồnETL tool built-in trong Excel
ETLTrích xuất-Biến đổi-NạpExtract, Transform, Load
Applied StepsCác bước đã áp dụngLịch sử transformations
M LanguageNgôn ngữ MCode behind Power Query
Query EditorTrình chỉnh sửa truy vấnInterface để transform data
DelimiterKý tự phân cáchComma, tab, semicolon
Promote HeadersĐẩy lên headerDùng row đầu làm tên cột
Fill DownĐiền xuốngCopy cell trên vào cells trống
UnpivotBỏ pivotChuyển wide → long format
Close & LoadĐóng và nạpĐưa data vào worksheet

Checkpoint

Power Query là ETL tool: Extract từ sources → Transform clean data → Load vào Excel. Mọi step được ghi lại trong Applied Steps — click Refresh để chạy lại tất cả. Game-changer!

2

💡 1. Power Query là gì?

TB5 min

Power Query = ETL tool (Extract, Transform, Load) built-in trong Excel, cho phép bạn:

  • 📥 Extract: Import data từ nhiều sources
  • 🔄 Transform: Clean và reshape data
  • 📤 Load: Đưa data sạch vào worksheet

Tại sao Power Query game-changer?

fxPower Query vs Manual
Trước Power Query
1. Mở file CSV5 phút
2. Xóa empty rows3 phút
3. Tách cột5 phút
4. Fix data types3 phút
5. Remove duplicates2 phút
Total: 18 phút × mỗi lần nhận file mới
Với Power Query
1. Setup 1 lần → 18 phút
2. Mỗi lần sau → Click "Refresh" → 5 giây! ✅

Power Query lưu lại tất cả steps — setup 1 lần, dùng mãi mãi. Khi source data thay đổi, chỉ cần Refresh → data sạch tự động! Đây là kỹ năng quan trọng nhất cho Data Analyst.

Checkpoint

Power Query = setup 1 lần, Refresh mãi mãi. Tiết kiệm hàng giờ mỗi tuần cho recurring reports. Đây là kỹ năng bắt buộc cho Data Analyst hiện đại. Bạn đã biết PQ chưa?

3

🖥️ 2. Power Query Interface

TB5 min

Data → Get Data → [Choose Source]

FileHomeTransformAdd ColumnView
fx= Table.SelectRows(#"Removed Errors", each [Revenue] > 0)

Queries

📋 Sales_Raw
📋 Products
📋 Final_Report
DateRegionProductRevenue
2026-01-15NorthLaptop45,000,000
2026-01-16SouthPhone12,500,000
2026-01-17NorthTablet8,200,000
... more rows

Applied Steps

📥1. Source
📋2. Promoted Headers
🔢3. Changed Type
🧹4. Removed Errors
🔍5. Filtered Rows
3+ rows × 4 columns
🖥️ Power Query Editor

Key Areas:

  • Queries Panel (trái): Danh sách queries
  • Data Preview (giữa): Xem trước data
  • Applied Steps (phải): Lịch sử transformations
  • Formula Bar: M language code

Checkpoint

PQ Editor có 4 vùng chính: Queries (trái), Data Preview (giữa), Applied Steps (phải), Formula Bar (trên). Applied Steps = recipe có thể undo/redo bất kỳ bước nào. Bạn đã mở PQ Editor chưa?

4

📥 3. Import Data Sources

TB5 min

3.1 From CSV / Text

fxImport CSV / Text
Data → Get Data → From File → From Text/CSV
Delimiter: Comma, Tab, Semicolon, Custom
Data Type Detection: First 200 rowsrecommended
Encoding: UTF-8, ANSI, etc.

3.2 From Excel Files

fxImport Excel
Data → Get Data → From File → From Workbook
Chọn file → Chọn Sheet hoặc Table
Edit để transform trước khi load

3.3 From Web

fxImport from Web
Data → Get Data → From Other Sources → From Web
URL: https://example.com/data-table
Power Query tự detect tables trên webpage
Chọn table → Transform → Load

3.4 From Folder (Multiple Files)

fxImport from Folder
Data → Get Data → From File → From Folder
Path: C:\Data\Monthly_Reports\
List tất cả files → Combine & Transform
Merge 12 files thành 1 table tự động! ✅

From Folder là tính năng mạnh nhất khi có nhiều files cùng format (monthly reports, daily exports). Power Query tự combine tất cả → 1 table. Thêm file mới vào folder → Refresh → Done!

Checkpoint

4 nguồn chính: CSV/Text, Excel, Web, Folder. From Folder mạnh nhất cho recurring reports — tự combine nhiều files. Bạn đã import từ nguồn nào chưa?

5

🔧 4. Basic Transformations

TB5 min

4.1 Remove Columns

fxRemove Columns
Right-click column header → Remove
Hoặc: Select columns to KEEP → Remove Other Columns
Best Practice: Remove Other Columns
Keep 5 columns, remove 50 unknown → Safer ✅

4.2 Change Data Types

fxData Types
Click column header icon → Choose type
📝 Text (ABC)
🔢 Whole Number (123)
💲 Decimal Number (1.23)
📅 Date (1/1/2026)
⏰ Date/Time
✅ True/False

4.3 Filter Rows

fxFilter Rows
Click dropdown arrow on column header
☐ (null)Bỏ null values
☑ North
☑ South
☐ (blank)Bỏ blank rows
Number filters → Greater than → 1000

4.4 Remove Rows

fxRemove Rows
Home → Remove Rows
Remove Top RowsBỏ X rows đầu (metadata)
Remove Bottom RowsBỏ X rows cuối (totals)
Remove Blank RowsBỏ rows trống
Remove DuplicatesBỏ trùng lặp
Remove ErrorsBỏ rows có lỗi

4.5 Replace Values

fxReplace Values
Transform → Replace Values
Find: "N/A" → Replace with: (null)
Find: " " → Replace with: " "double space → single

Thứ tự steps quan trọng! Filter rows và remove columns sớm nhất có thể — giảm data size → tăng performance cho các steps sau. Đây là best practice #1 trong Power Query.

Checkpoint

Basic transforms: Remove Columns, Change Types, Filter Rows, Remove Rows, Replace Values. Golden rule: filter early, remove early → better performance. Bạn đã thực hành chưa?

6

✂️ 5. Column Transformations

TB5 min

5.1 Split Column

fxSplit Column
Transform → Split Column
By Delimiter: "John Smith" → "John" | "Smith"
By Number of Characters: "ABC123" → "ABC" | "123"
Ví dụ split "Full Name"
Column: "Nguyễn Văn A"
Split by: Space, from Right Most delimiter
→ "Nguyễn Văn" | "A"

5.2 Merge Columns

fxMerge Columns
Select multiple columns → Transform → Merge Columns
Separator: Space
New column: "Full Address"
"123 Main St" + "Hanoi" + "Vietnam"
→ "123 Main St Hanoi Vietnam"

5.3 Extract

fxExtract
Transform → Extract
First Characters: "LAPTOP-001" → "LAP"
Last Characters: "LAPTOP-001" → "001"
Text Before Delimiter: "john@email.com" → "john"
Text After Delimiter: "john@email.com" → "email.com"

5.4 Format Text

fxFormat Text
Transform → Format
Lowercase / Uppercase / Capitalize Each Word
Trim: " hello " → "hello"
Clean: Remove non-printable characters

5.5 Add Column from Examples

fxColumn from Examples
Add Column → Column from Examples
Power Query AI detects patterns
Original: "2026-01-15" → Example: "January"
→ Auto-generates formula for all rows: Month name extraction

Column from Examples là AI magic! Chỉ cần gõ 1-2 ví dụ → PQ tự detect pattern và áp dụng cho tất cả rows. Rất mạnh cho date parsing, text extraction, format conversion.

Checkpoint

Column transforms: Split, Merge, Extract, Format, From Examples. Column from Examples là tính năng AI — gõ ví dụ, PQ tự học pattern. Bạn đã thử feature này chưa?

7

📅 6. Date Transformations

TB5 min

6.1 Extract Date Parts

fxExtract Date Parts
Select date column → Transform → Date
Year2026
Month1
Day15
Day of WeekThursday
Quarter1
Week of Year3
Add Column → Date
Month NameJanuary
Day NameThursday
Start of Month1/1/2026
End of Month1/31/2026

6.2 Date Calculations

fxCustom Column — Date Calculation
Add Column → Custom Column
Name: "Days_Since_Order"
= Duration.Days(DateTime.LocalNow() - [OrderDate])

Checkpoint

Extract: Year, Month, Quarter, Day of Week — tạo time dimensions cho analysis. Custom Column cho date calculations (age, days since). Bạn đã tạo date columns chưa?

8

🔄 7. Refresh & Load Options

TB5 min

7.1 Load To

fxClose & Load To
Home → Close & Load → Close & Load To
☐ TableLoad vào worksheet
☐ PivotTableCreate PivotTable trực tiếp
☐ PivotChartCreate PivotChart
☑ Only Create ConnectionKhông load (dùng cho Data Model)

7.2 Refresh Data

fxRefresh Data
1. Source file gets updated (new CSV, updated webpage)
2. Excel: Data → Refresh All (Ctrl + Alt + F5)
3. Power Query re-runs ALL steps automatically
4. Data in worksheet = updated & clean! ✅

7.3 Auto-Refresh

fxAuto-Refresh Settings
Right-click query → Properties
☑ Refresh every X minutes
☑ Refresh data when opening file
☐ Enable background refresh

Auto-Refresh biến Excel thành live dashboard — data tự update theo schedule hoặc mỗi lần mở file. Kết hợp với PivotTables → real-time reporting system!

Checkpoint

Close & Load: table, PivotTable, hoặc connection only. Refresh All (Ctrl+Alt+F5) chạy lại tất cả queries. Auto-Refresh = live dashboard. Bạn đã setup auto-refresh chưa?

9

🧹 8. Thực hành: Clean Messy Data

TB5 min
Thực hành trên Excel

Transform messy CSV thành clean data — đây là skill thực tế nhất của Power Query!

Problem: Dirty Sales CSV

csv
1,,Sales Report 2026,,
2,,Generated: 2026-01-15,,
3,,,
4 Date , Product Name , Region , revenue
501/05/2026, Laptop Pro ,NORTH, 15000
601/06/2026,Phone X,,8000
7, Tablet Air , South , N/A
801/08/2026,,East,6000
9???,,West,
1001/10/2026,Laptop Pro,North,$12,000

Solution Steps (Applied Steps):

fx13 Applied Steps
1. SourceImport CSV
2. Remove Top 3 RowsSkip header metadata
3. Promote HeadersUse first row as headers
4. Trim TextRemove extra spaces
5. Clean TextRemove non-printable chars
6. Uppercase RegionStandardize
7. Replace "N/A" with null
8. Remove Blank Rows
9. Remove Error RowsFilter out ???
10. Change TypesDate, Text, Text, Number
11. Fill Down RegionFill missing regions
12. Remove $ from Revenue
13. Rename ColumnsClean names
💡 Result: Clean, consistent data ready for analysis!

Practical Tips

fxBest Practices
Query Naming: Sales_Raw → Sales_Cleaned → Sales_Final
Step Naming: Right-click → Rename → "Set Date and Number types"
Performance: Filter early, remove columns early

Checkpoint

Bạn đã clean được messy data với Power Query chưa? Kiểm tra: data types đúng, columns clean, và nhấn Refresh để thấy kết quả tự cập nhật!

10

� 9. Tổng Kết

TB5 min

Kiến thức đã học

Chủ đềNội dung chínhTầm quan trọng
Power QueryETL tool, setup 1 lầnGame-changer skill
Import SourcesCSV, Excel, Web, FolderData acquisition
Basic TransformsFilter, sort, remove, replaceData cleaning
Column TransformsSplit, merge, extract, examplesData reshaping
Date TransformsExtract parts, calculationsTime analysis
Refresh & LoadAuto-update, load optionsAutomation

Câu hỏi tự kiểm tra

  1. Power Query giải quyết vấn đề gì so với formulas thông thường?
  2. Các bước ETL cơ bản trong Power Query là gì?
  3. "Close & Load To..." khác "Close & Load" thế nào?
  4. Refresh data trong Power Query hoạt động ra sao?

Bài tiếp theo: Power Query Advanced — Merge, Append, M Language basics

Key Takeaways:

  • Power Query = ETL tool, setup 1 lần, Refresh mãi mãi
  • Import từ nhiều nguồn: CSV, Excel, Web, Folder
  • Basic Transforms: filter, sort, remove, replace cho data cleaning
  • Column Transforms: split, merge, extract cho data reshaping
  • Date Transforms: extract parts, calculations cho time analysis
  • Power Query là game-changer cho mọi Data Analyst!