MinAI - Về trang chủ
Quiz
13/1330 phút
Đang tải...

Quiz tổng hợp

Kiểm tra kiến thức toàn khóa học Advanced Data Analysis

0

🎯 Mục tiêu bài Quiz

TB5 min

Kiểm tra kiến thức của bạn qua các câu hỏi trắc nghiệm và bài tập thực hành!

✅ 18 câu hỏi trắc nghiệm (6 phần)

✅ 3 bài tập thực hành

✅ Yêu cầu: Hoàn thành bài 1-12

Thời gian: 30 phút | Độ khó: Tổng hợp | Đạt yêu cầu: ≥ 13/18 câu đúng

1

Phần 1: Cohort & Funnel Analysis

TB5 min
2

Phần 2: RFM & Customer Analytics

TB5 min
3

Phần 3: Time Series Analysis

TB5 min
4

Phần 4: A/B Testing

TB5 min
5

Phần 5: Anomaly Detection

TB5 min
6

Phần 6: Market Basket & Advanced Analytics

TB5 min
7

Phần 7: Bài tập thực hành

TB5 min

Bài tập 1: Cohort Retention Analysis

Tình huống: Bạn có bảng dữ liệu giao dịch với các cột: customer_id, order_date, revenue. Hãy mô tả các bước để xây dựng Cohort Retention Table bằng Python/Pandas.

Đáp án
Python
1# Bước 1: Xác định cohort month (tháng đầu tiên mua hàng)
2df['order_month'] = df['order_date'].dt.to_period('M')
3cohort = df.groupby('customer_id')['order_month'].min().rename('cohort_month')
4df = df.merge(cohort, on='customer_id')
5
6# Bước 2: Tính cohort index (khoảng cách tháng)
7df['cohort_index'] = (df['order_month'] - df['cohort_month']).apply(lambda x: x.n)
8
9# Bước 3: Đếm số unique customers mỗi cohort × cohort_index
10cohort_table = df.groupby(['cohort_month', 'cohort_index'])['customer_id'].nunique().unstack()
11
12# Bước 4: Tính retention rate (%)
13cohort_size = cohort_table.iloc[:, 0]
14retention = cohort_table.divide(cohort_size, axis=0) * 100

Bài tập 2: A/B Test Evaluation

Tình huống: A/B test trên landing page mới. Nhóm A (control): 5.000 users, 200 conversions. Nhóm B (variant): 5.000 users, 260 conversions. α = 0.05. Hãy đánh giá kết quả.

Đáp án
Python
1from scipy import stats
2import numpy as np
3
4# Conversion rates
5cr_a = 200 / 5000 # 4.0%
6cr_b = 260 / 5000 # 5.2%
7
8# Z-test for proportions
9p_pool = (200 + 260) / (5000 + 5000) # pooled proportion
10se = np.sqrt(p_pool * (1 - p_pool) * (1/5000 + 1/5000))
11z_stat = (cr_b - cr_a) / se
12p_value = 2 * (1 - stats.norm.cdf(abs(z_stat)))
13# p_value ≈ 0.007 < 0.05 → Bác bỏ H₀
14# Kết luận: Variant B có conversion rate cao hơn có ý nghĩa thống kê
15# Relative lift: (5.2% - 4.0%) / 4.0% = +30%

Bài tập 3: RFM Segmentation

Tình huống: Bạn có dữ liệu giao dịch. Hãy viết code Python phân khúc khách hàng theo RFM và gán nhãn segment.

Đáp án
Python
1import pandas as pd
2from datetime import datetime
3
4# Tính R, F, M cho mỗi khách hàng
5snapshot_date = df['order_date'].max() + pd.Timedelta(days=1)
6rfm = df.groupby('customer_id').agg(
7 Recency=('order_date', lambda x: (snapshot_date - x.max()).days),
8 Frequency=('order_id', 'nunique'),
9 Monetary=('revenue', 'sum')
10)
11
12# Gán điểm 1-5 bằng qcut
13rfm['R_score'] = pd.qcut(rfm['Recency'], 5, labels=[5,4,3,2,1])
14rfm['F_score'] = pd.qcut(rfm['Frequency'].rank(method='first'), 5, labels=[1,2,3,4,5])
15rfm['M_score'] = pd.qcut(rfm['Monetary'], 5, labels=[1,2,3,4,5])
16
17# Gán segment
18def segment(row):
19 if row['R_score'] >= 4 and row['F_score'] >= 4:
20 return 'Champions'
21 elif row['R_score'] >= 3 and row['F_score'] >= 3:
22 return 'Loyal'
23 elif row['R_score'] >= 4 and row['F_score'] <= 2:
24 return 'New Customers'
25 elif row['R_score'] <= 2 and row['F_score'] >= 3:
26 return 'At Risk'
27 else:
28 return 'Need Attention'
29
30rfm['Segment'] = rfm.apply(segment, axis=1)
8

📊 Đánh giá kết quả

TB5 min
Số câu đúngĐánh giá
16-18🌟 Xuất sắc! Bạn nắm vững Advanced Data Analysis
13-15👍 Tốt! Cần ôn lại một số chủ đề
9-12📚 Cần học thêm, xem lại các bài
< 9🔄 Nên học lại từ đầu
9

🎓 Hoàn thành khóa học!

TB5 min

🎉 Tuyệt vời! Bạn đã hoàn thành toàn bộ khóa học Advanced Data Analysis!

Tiếp theo: Hãy áp dụng các kỹ thuật phân tích nâng cao vào dự án thực tế và tiếp tục học Machine Learning hoặc Deep Learning!

Chúc mừng!

Bạn đã hoàn thành khóa học Advanced Data Analysis!

Kỹ năng phân tích nâng cao sẽ giúp bạn:

  • 📊 Cohort & Funnel Analysis để đo lường retention và conversion
  • 📈 Time Series Analysis để dự báo xu hướng kinh doanh
  • 🧪 A/B Testing để ra quyết định dựa trên dữ liệu
  • 🛒 Market Basket Analysis để tối ưu cross-selling
  • 🔍 Anomaly Detection để phát hiện bất thường kịp thời
  • 💰 RFM & CLV để phân khúc và tối ưu giá trị khách hàng

Next steps:

  • Xây dựng portfolio với các case study phân tích thực tế
  • Học tiếp Machine Learning và Deep Learning
  • Áp dụng A/B Testing và Cohort Analysis vào dự án công việc