Giới thiệu khóa học Machine Learning Fundamentals
🎯 Mục tiêu khóa học
Sau khi hoàn thành khóa học này, học viên sẽ:
- Hiểu vững lý thuyết: Nắm chắc các khái niệm cốt lõi của Machine Learning
- Áp dụng thực tế: Xây dựng và đánh giá mô hình ML với Python/Scikit-learn
- Tư duy phân tích: Lựa chọn thuật toán phù hợp cho từng bài toán cụ thể
- Đánh giá chuyên sâu: Hiểu sâu về Gini, ROC-AUC, Threshold và các metrics quan trọng
📊 Tổng quan nội dung
Cấu trúc khóa học
| Module | Chủ đề | Nội dung chính |
|---|---|---|
| Supervised Learning | Regression | Linear Regression, Polynomial Regression |
| Classification | Logistic Regression, Decision Tree, Random Forest, SVM | |
| Unsupervised Learning | Clustering | K-Means |
| Dimensionality Reduction | PCA | |
| Anomaly Detection | Isolation Forest | |
| Evaluation | Metrics cơ bản | Accuracy, Precision, Recall, F1-Score |
| Metrics nâng cao | Gini Impurity, ROC-AUC, Threshold Analysis | |
| Model Optimization | Tuning | Cross-Validation, Hyperparameter Tuning, Ensemble Methods |
Hình: Scikit-learn Algorithm Cheat Sheet - Hướng dẫn chọn thuật toán phù hợp
🗓️ Lộ trình 10 tuần
| Tuần | Nội dung | Số buổi |
|---|---|---|
| 1 | Giới thiệu ML và Nền tảng toán học | 2 |
| 2-3 | Data Processing và EDA | 4 |
| 4-6 | Supervised Learning - Regression | 6 |
| 7-8 | Supervised Learning - Classification | 4 |
| 9 | Unsupervised Learning | 3 |
| 10 | Ensemble Methods và Tổng kết | 3 |
🛠️ Công nghệ sử dụng
- Python 3.10+
- NumPy - Tính toán số học
- Pandas - Xử lý dữ liệu
- Scikit-learn - Thuật toán ML
- Matplotlib/Seaborn - Trực quan hóa
📚 Cấu trúc mỗi bài học
Mỗi bài học được thiết kế theo cấu trúc chuẩn:
- Mục tiêu bài học - Kiến thức và kỹ năng cần đạt
- Lý thuyết và Công thức - Định nghĩa, giải thích trực quan
- Ví dụ tính toán thủ công - Hiểu bản chất thuật toán
- Ứng dụng thực tế - Các case studies thực tế
- Thực hành Python - Code từng bước với Scikit-learn
- Ưu nhược điểm - So sánh và lựa chọn mô hình
- Bài tập tự luyện - Củng cố kiến thức
🎓 Đối tượng phù hợp
- Sinh viên IT, Data Science
- Người mới bắt đầu với Machine Learning
- Lập trình viên muốn chuyển sang AI/ML
- Analysts muốn nâng cao kỹ năng phân tích
✅ Yêu cầu tiên quyết
- Biết lập trình Python cơ bản
- Hiểu biết cơ bản về thống kê
- Có máy tính cài Python 3.10+
