🎯 Mục tiêu bài Quiz
Kiểm tra kiến thức của bạn qua các câu hỏi trắc nghiệm và bài tập thực hành!
✅ 18 câu hỏi trắc nghiệm (6 phần)
✅ 3 bài tập thực hành
✅ Yêu cầu: Hoàn thành bài 1-12
Thời gian: 30 phút | Độ khó: Tổng hợp | Đạt yêu cầu: ≥ 13/18 câu đúng
Phần 1: Cohort & Funnel Analysis
Phần 2: RFM & Customer Analytics
Phần 3: Time Series Analysis
Phần 4: A/B Testing
Phần 5: Anomaly Detection
Phần 6: Market Basket & Advanced Analytics
Phần 7: Bài tập thực hành
Bài tập 1: Cohort Retention Analysis
Tình huống: Bạn có bảng dữ liệu giao dịch với các cột: customer_id, order_date, revenue. Hãy mô tả các bước để xây dựng Cohort Retention Table bằng Python/Pandas.
1# Bước 1: Xác định cohort month (tháng đầu tiên mua hàng)2df['order_month'] = df['order_date'].dt.to_period('M')3cohort = df.groupby('customer_id')['order_month'].min().rename('cohort_month')4df = df.merge(cohort, on='customer_id')56# Bước 2: Tính cohort index (khoảng cách tháng)7df['cohort_index'] = (df['order_month'] - df['cohort_month']).apply(lambda x: x.n)89# Bước 3: Đếm số unique customers mỗi cohort × cohort_index10cohort_table = df.groupby(['cohort_month', 'cohort_index'])['customer_id'].nunique().unstack()1112# Bước 4: Tính retention rate (%)13cohort_size = cohort_table.iloc[:, 0]14retention = cohort_table.divide(cohort_size, axis=0) * 100Bài tập 2: A/B Test Evaluation
Tình huống: A/B test trên landing page mới. Nhóm A (control): 5.000 users, 200 conversions. Nhóm B (variant): 5.000 users, 260 conversions. α = 0.05. Hãy đánh giá kết quả.
1from scipy import stats2import numpy as np34# Conversion rates5cr_a = 200 / 5000 # 4.0%6cr_b = 260 / 5000 # 5.2%78# Z-test for proportions9p_pool = (200 + 260) / (5000 + 5000) # pooled proportion10se = np.sqrt(p_pool * (1 - p_pool) * (1/5000 + 1/5000))11z_stat = (cr_b - cr_a) / se12p_value = 2 * (1 - stats.norm.cdf(abs(z_stat)))13# p_value ≈ 0.007 < 0.05 → Bác bỏ H₀14# Kết luận: Variant B có conversion rate cao hơn có ý nghĩa thống kê15# Relative lift: (5.2% - 4.0%) / 4.0% = +30%Bài tập 3: RFM Segmentation
Tình huống: Bạn có dữ liệu giao dịch. Hãy viết code Python phân khúc khách hàng theo RFM và gán nhãn segment.
1import pandas as pd2from datetime import datetime34# Tính R, F, M cho mỗi khách hàng5snapshot_date = df['order_date'].max() + pd.Timedelta(days=1)6rfm = df.groupby('customer_id').agg(7 Recency=('order_date', lambda x: (snapshot_date - x.max()).days),8 Frequency=('order_id', 'nunique'),9 Monetary=('revenue', 'sum')10)1112# Gán điểm 1-5 bằng qcut13rfm['R_score'] = pd.qcut(rfm['Recency'], 5, labels=[5,4,3,2,1])14rfm['F_score'] = pd.qcut(rfm['Frequency'].rank(method='first'), 5, labels=[1,2,3,4,5])15rfm['M_score'] = pd.qcut(rfm['Monetary'], 5, labels=[1,2,3,4,5])1617# Gán segment18def segment(row):19 if row['R_score'] >= 4 and row['F_score'] >= 4:20 return 'Champions'21 elif row['R_score'] >= 3 and row['F_score'] >= 3:22 return 'Loyal'23 elif row['R_score'] >= 4 and row['F_score'] <= 2:24 return 'New Customers'25 elif row['R_score'] <= 2 and row['F_score'] >= 3:26 return 'At Risk'27 else:28 return 'Need Attention'2930rfm['Segment'] = rfm.apply(segment, axis=1)📊 Đánh giá kết quả
| Số câu đúng | Đánh giá |
|---|---|
| 16-18 | 🌟 Xuất sắc! Bạn nắm vững Advanced Data Analysis |
| 13-15 | 👍 Tốt! Cần ôn lại một số chủ đề |
| 9-12 | 📚 Cần học thêm, xem lại các bài |
| < 9 | 🔄 Nên học lại từ đầu |
🎓 Hoàn thành khóa học!
🎉 Tuyệt vời! Bạn đã hoàn thành toàn bộ khóa học Advanced Data Analysis!
Tiếp theo: Hãy áp dụng các kỹ thuật phân tích nâng cao vào dự án thực tế và tiếp tục học Machine Learning hoặc Deep Learning!
Bạn đã hoàn thành khóa học Advanced Data Analysis!
Kỹ năng phân tích nâng cao sẽ giúp bạn:
- 📊 Cohort & Funnel Analysis để đo lường retention và conversion
- 📈 Time Series Analysis để dự báo xu hướng kinh doanh
- 🧪 A/B Testing để ra quyết định dựa trên dữ liệu
- 🛒 Market Basket Analysis để tối ưu cross-selling
- 🔍 Anomaly Detection để phát hiện bất thường kịp thời
- 💰 RFM & CLV để phân khúc và tối ưu giá trị khách hàng
Next steps:
- Xây dựng portfolio với các case study phân tích thực tế
- Học tiếp Machine Learning và Deep Learning
- Áp dụng A/B Testing và Cohort Analysis vào dự án công việc
