MinAI - Về trang chủ
Tổng quan
1/1230 phút
Đang tải...

Tổng quan & Mục tiêu khóa học

Giới thiệu tổng quan về Thống kê, vai trò trong Data Science và mục tiêu khóa học

0

🎯 Mục tiêu bài học

TB5 min

Sau bài học này, bạn sẽ:

✅ Hiểu Thống kê là gì và tại sao quan trọng trong Data Science

✅ Phân biệt Thống kê Mô tả và Thống kê Suy luận

✅ Nắm được lộ trình khóa học và các công cụ sử dụng

✅ Hiểu phương pháp học tập hiệu quả

Thời gian: 30 phút | Độ khó: Beginner | Yêu cầu: Toán cơ bản

1

📖 Bảng Thuật Ngữ Quan Trọng

TB5 min
Thuật ngữTiếng ViệtMô tả
StatisticsThống kêKhoa học thu thập, phân tích, giải thích dữ liệu
Descriptive StatisticsThống kê mô tảTóm tắt và mô tả dữ liệu
Inferential StatisticsThống kê suy luậnSuy luận về tổng thể từ mẫu
PopulationTổng thểToàn bộ đối tượng nghiên cứu
SampleMẫuMột phần của tổng thể được chọn để nghiên cứu
ParameterTham sốĐại lượng mô tả tổng thể
StatisticThống kê lượngĐại lượng tính từ mẫu

Checkpoint

Bạn có thể phân biệt Population vs Sample chưa? Đây là nền tảng của toàn bộ khóa học!

2

📊 Thống kê là gì?

TB5 min

Thống kê (Statistics) là ngành khoa học về việc thu thập, phân tích, giải thích và trình bày dữ liệu. Thống kê giúp chúng ta đưa ra quyết định dựa trên dữ liệu thực tế.

Tại sao Thống kê quan trọng?

Thống kê là nền tảng của Data Science, Machine Learning và AI. Hiểu thống kê giúp bạn phân tích dữ liệu đúng cách, đánh giá model chính xác và đưa ra quyết định có cơ sở khoa học.

3

🌳 Hai Nhánh Chính của Thống kê

TB5 min
📊Statistics
📈Descriptive Statistics
Measures of Central Tendency
Measures of Spread
Data Visualization
🔬Inferential Statistics
Hypothesis Testing
Confidence Intervals
Regression Analysis

1. Thống kê Mô tả (Descriptive Statistics)

  • Tóm tắt và mô tả dữ liệu
  • Các độ đo tập trung: Mean, Median, Mode
  • Các độ đo phân tán: Variance, Standard Deviation
  • Trực quan hóa dữ liệu: Histogram, Box Plot

2. Thống kê Suy luận (Inferential Statistics)

  • Suy luận về tổng thể từ mẫu
  • Kiểm định giả thuyết (Hypothesis Testing)
  • Khoảng tin cậy (Confidence Intervals)
  • Phân tích hồi quy (Regression Analysis)

Checkpoint

Nếu bạn tính điểm trung bình của lớp — đó là Descriptive hay Inferential Statistics? Còn khi bạn suy luận điểm trung bình toàn trường từ 1 lớp mẫu thì sao?

4

🌍 Ứng dụng của Thống kê

TB5 min
Lĩnh vựcỨng dụng
🏥 Y tếClinical Trials, Drug Testing
💰 Tài chínhRisk Analysis, Portfolio Optimization
🛒 MarketingA/B Testing, Customer Segmentation
🤖 Machine LearningModel Evaluation, Feature Selection
🏭 Sản xuấtQuality Control, Process Improvement
🎮 GamingPlayer Analytics, Balancing
5

📋 Nội Dung Khóa Học

TB5 min

1. Thống kê Mô tả (Descriptive Statistics)

  • ✅ Tính toán các độ đo tập trung: Mean, Median, Mode
  • ✅ Tính toán các độ đo phân tán: Range, Variance, Standard Deviation
  • ✅ Hiểu và sử dụng Percentiles, Quartiles, IQR
  • ✅ Phát hiện và xử lý Outliers

2. Xác suất (Probability)

  • ✅ Nắm vững các quy tắc xác suất cơ bản
  • ✅ Hiểu xác suất có điều kiện và Bayes' Theorem
  • ✅ Áp dụng vào bài toán thực tế

3. Phân phối Xác suất (Probability Distributions)

  • ✅ Phân phối rời rạc: Binomial, Poisson
  • ✅ Phân phối liên tục: Normal, Exponential
  • ✅ Central Limit Theorem

4. Thống kê Suy luận (Inferential Statistics)

  • ✅ Sampling và Sampling Distribution
  • ✅ Confidence Intervals
  • ✅ Hypothesis Testing (Z-test, T-test, Chi-square)
  • ✅ P-value và Statistical Significance

5. Correlation và Regression

  • ✅ Pearson vs Spearman Correlation
  • ✅ Simple Linear Regression
  • ✅ R-squared và Model Evaluation
6

📅 Cấu Trúc Bài Học

TB5 min
STTChủ đềThời lượng
1Tổng quan & Mục tiêu30 phút
2Descriptive Statistics - Central Tendency1 giờ
3Descriptive Statistics - Spread1 giờ
4Percentiles & Outliers45 phút
5Probability & Bayes' Theorem2 giờ
6Discrete Distributions1.5 giờ
7Continuous Distributions1.5 giờ
8Sampling & CLT1 giờ
9Confidence Intervals1 giờ
10Hypothesis Testing & T-tests2.5 giờ
11Correlation & Regression1.5 giờ
12Quiz tổng hợp30 phút
7

🗺️ Roadmap Khóa Học

TB5 min
1
📋Tổng quan
2
📊Descriptive Stats
3
🎲Probability
4
📈Distributions
5
🎯Sampling
6
🔬Hypothesis Testing
7
📉Correlation & Regression
8
📝Quiz
8

📝 Phương Pháp Học

TB5 min

Quy trình học tập

📖Lý thuyết
✍️Ví dụ tính tay
💻Code Python
📊Visualization
🧩Bài tập
📝Quiz

Checkpoint

Phương pháp học hiệu quả nhất: Lý thuyết → Ví dụ tính tay → Code Python → Visualization → Bài tập. Hãy luôn thực hành song song với lý thuyết!

9

🎓 Kết Quả Đầu Ra

TB5 min

Câu hỏi tự kiểm tra

  1. Thống kê mô tả và Thống kê suy luận khác nhau ở điểm nào?
  2. Phân biệt Population (tổng thể) và Sample (mẫu) — tại sao sự phân biệt này quan trọng?
  3. Thống kê đóng vai trò gì trong Data Science và Machine Learning?
  4. Tại sao cần kết hợp lý thuyết với thực hành code Python khi học thống kê?
Kỹ năng đạt được
  1. Phân tích dữ liệu một cách khoa học
  2. Đưa ra quyết định dựa trên dữ liệu
  3. Thiết kế thí nghiệm (A/B Testing)
  4. Đánh giá model Machine Learning
  5. Trình bày kết quả thống kê chuyên nghiệp

🎉 Tuyệt vời! Bạn đã hoàn thành bài học Tổng quan & Mục tiêu khóa học!

Tiếp theo: Chúng ta sẽ bắt đầu với bài học đầu tiên — Đo lường xu hướng trung tâm (Mean, Median, Mode).

Yêu cầu tiên quyết

  • 📐 Toán cơ bản (số học, đại số)
  • 🐍 Python cơ bản (khuyến khích)
  • 💡 Tư duy logic

Tiến độ học tập khuyến nghị

  • Beginner: 2-3 bài/tuần
  • Intermediate: 3-4 bài/tuần
  • Advanced: Có thể học nhanh hơn
Mẹo học hiệu quả
  • Làm bài tập sau mỗi bài học
  • Thực hành code Python
  • Ghi chú các công thức quan trọng
  • Áp dụng vào dự án thực tế