🎯 Mục tiêu bài học
- Hiểu hệ sinh thái thương mại điện tử Việt Nam và các mô hình kinh doanh
- Nắm được vai trò Data Analyst trong E-commerce và các team liên quan
- Hiểu quy trình dữ liệu từ platform đến analytics
- Làm quen với dataset ShopVN — 8 bảng, 3.4 triệu records
- Xác định lộ trình học tập và career path trong E-commerce Analytics
| Thông tin | Chi tiết |
|---|---|
| ⏱️ Thời lượng | 45 phút |
| 📖 Chủ đề chính | E-commerce ecosystem, DA role, ShopVN dataset |
| 💡 Kiến thức cần có | Không yêu cầu |
| 🎯 Output | Hiểu toàn cảnh ngành và định hướng học tập |
📖 Thuật ngữ quan trọng
| Thuật ngữ | Tiếng Việt | Mô tả |
|---|---|---|
| TMĐT | Thương mại điện tử | E-commerce — mua bán hàng hóa qua Internet |
| Marketplace | Sàn thương mại điện tử | Nền tảng kết nối người mua và người bán (Shopee, Lazada, Tiki) |
| GMV | Gross Merchandise Value | Tổng giá trị hàng hóa giao dịch (bao gồm cả đơn hủy, trả hàng) |
| AOV | Average Order Value | Giá trị đơn hàng trung bình |
| Conversion Rate | Tỷ lệ chuyển đổi | Phần trăm khách truy cập thực hiện hành động mong muốn |
| Funnel | Phễu chuyển đổi | Các bước khách hàng trải qua từ xem đến mua |
| RFM | Recency, Frequency, Monetary | Mô hình phân khúc khách hàng dựa trên hành vi mua |
| CLV | Customer Lifetime Value | Giá trị vòng đời khách hàng — tổng doanh thu kỳ vọng |
| Cohort | Nhóm đồng đại | Nhóm khách hàng có chung đặc điểm (ngày đăng ký, tháng mua đầu) |
| SKU | Stock Keeping Unit | Mã quản lý sản phẩm/biến thể |
Checkpoint
Thương mại điện tử (TMĐT) hoạt động trên mô hình Marketplace — kết nối người mua và người bán. Các chỉ số quan trọng gồm GMV (tổng giá trị giao dịch), AOV (giá trị đơn trung bình), và Conversion Rate (tỷ lệ chuyển đổi). RFM là mô hình phân khúc khách hàng phổ biến nhất trong E-commerce.
🛒 Hệ sinh thái E-commerce Việt Nam
Tính đến 2025, thị trường TMĐT Việt Nam đạt 25 tỷ USD, tăng trưởng 25%/năm — nhanh nhất Đông Nam Á. Với 60+ triệu người mua online, E-commerce là ngành có nhu cầu Data Analyst cao nhất Việt Nam.
Cấu trúc hệ sinh thái
Hệ sinh thái E-commerce Việt Nam 2025
Các mô hình E-commerce chính
| Mô hình | Ví dụ | Đặc điểm | Data chính |
|---|---|---|---|
| B2C Marketplace | Shopee, Lazada, Tiki | Sàn kết nối seller - buyer | Orders, Products, Sellers, Reviews |
| D2C (Direct to Consumer) | TGDĐ, CellphoneS | Brand bán trực tiếp | Customer Journey, Inventory, CRM |
| C2C | Chợ Tốt, Facebook | Cá nhân bán cho cá nhân | Listings, Messages, Transactions |
| Social Commerce | TikTok Shop, FB Shops | Bán hàng qua mạng xã hội | Content, Engagement, Conversion |
| Quick Commerce | GrabMart, ShopeeFood | Giao nhanh trong 1-2 giờ | Delivery, Real-time Inventory |
E-commerce là ngành data-driven nhất vì mọi hành vi khách hàng đều được ghi nhận: từ lúc xem sản phẩm, thêm vào giỏ, đặt hàng, đến đánh giá. Điều này tạo ra khối lượng dữ liệu khổng lồ và nhu cầu phân tích rất cao.
👨💼 Vai trò Data Analyst trong E-commerce
Các team cần Data Analyst
| # | Team | Lĩnh vực | Công việc chính |
|---|---|---|---|
| 1 | 📊 Business Analytics | Tổng quan kinh doanh | GMV tracking, P&L analysis, market share |
| 2 | 🔍 Product Analytics | Sản phẩm/Platform | A/B testing, feature adoption, UX metrics |
| 3 | 👥 CRM / Customer | Khách hàng | Segmentation, CLV, churn prediction, personalization |
| 4 | 📢 Marketing Analytics | Marketing | Attribution, CAC, ROAS, campaign optimization |
| 5 | 🏪 Seller/Merchant | Người bán | Seller quality, onboarding analytics, GMV per seller |
| 6 | 🚚 Operations / Logistics | Vận hành | Fulfillment rate, delivery time, return analysis |
| 7 | 💰 Finance Analytics | Tài chính | Revenue recognition, payment analysis, fraud detection |
Kỹ năng yêu cầu
| Kỹ năng | Mức độ | Ứng dụng trong E-commerce |
|---|---|---|
| SQL | Bắt buộc | Query order data, funnel analysis, cohort queries |
| Excel | Bắt buộc | Ad-hoc analysis, pivot tables, weekly reports |
| Power BI/Tableau | Quan trọng | Dashboard GMV, conversion funnel, seller scorecard |
| Python | Nice-to-have | Automation, RFM scoring, cohort analysis |
| A/B Testing | Quan trọng | Product experiments, pricing tests |
| Domain Knowledge | Bắt buộc | Hiểu marketplace metrics, e-commerce operations |
Career Path
Lộ trình nghề nghiệp Data Analyst E-commerce
| Vị trí | Mức lương | Kinh nghiệm | Kỹ năng nổi bật |
|---|---|---|---|
| 🌱 Junior DA | 8–14M VND | 0–1 năm | SQL cơ bản, Excel, weekly reports |
| 📊 Data Analyst | 14–22M VND | 1–3 năm | SQL nâng cao, BI tools, funnel analysis |
| ⭐ Senior DA / Lead | 22–40M VND | 3–5 năm | Python, A/B testing, strategic insights |
| 👔 Analytics Manager | 40–70M VND | 5+ năm | Team leadership, data strategy, cross-functional |
E-commerce là ngành có nhu cầu tuyển DA cao nhất tại Việt Nam nhờ:
- 🚀 Tăng trưởng 25%/năm tạo nhiều vị trí mới
- 📊 Mọi quyết định đều cần data (pricing, promotion, inventory)
- 🌏 Cơ hội làm việc cho công ty regional/global (Shopee, Lazada, TikTok)
📊 Quy trình dữ liệu trong E-commerce
Data Flow Architecture
Luồng dữ liệu trong E-commerce Platform
| Giai đoạn | Thành phần | Chi tiết |
|---|---|---|
| 📱 User Interactions | Website/App | Page views, clicks, searches, add to cart |
| Order System | Đơn hàng, thanh toán, trạng thái | |
| Seller Portal | Sản phẩm, inventory, pricing | |
| Customer Support | Tickets, reviews, returns | |
| ⚙️ Data Pipeline | ETL (Airflow, Spark) | Trích xuất, chuyển đổi, tải dữ liệu |
| 🗄️ Data Warehouse | BigQuery / Redshift | Star Schema — Fact + Dimension tables |
| 📊 Analytics & BI | Dashboards | GMV, conversion, seller performance |
| Ad-hoc Reports | Deep-dive analysis theo yêu cầu | |
| ML Models | Recommendation, fraud detection, demand forecast |
Các loại dữ liệu chính
| Loại dữ liệu | Ví dụ | Tần suất | Bảng trong khóa học |
|---|---|---|---|
| Customer Data | Profile, segments, CLV | Real-time | dim_customer |
| Product Catalog | SKU, giá, category, brand | Daily | dim_product |
| Seller Info | Shop profile, rating, fulfillment | Daily | dim_seller |
| Time Dimension | Ngày, tuần, tháng, quý, lễ | Static | dim_time |
| Orders | Đơn hàng, payment, shipping | Real-time | fact_orders |
| Order Items | Chi tiết line items, returns | Real-time | fact_order_items |
| Reviews | Rating, review text, images | Daily | fact_reviews |
| Page Views | Browsing behavior, sessions | Real-time | fact_page_views |
Dữ liệu E-commerce có đặc thù riêng:
- Volume cực lớn: Hàng triệu page views/ngày, cần query tối ưu
- Real-time: Nhiều metrics cần theo dõi gần real-time (GMV, conversion)
- Seasonality: Doanh số biến động mạnh vào các dịp sale (11.11, 12.12, Tết)
- Data quality: Cần xử lý đơn hủy, trả hàng, fraud orders trước khi phân tích
📚 Giới thiệu Dataset ShopVN
ShopVN — Dataset khóa học
ShopVN là sàn thương mại điện tử mô phỏng, được thiết kế sát với thực tế marketplace Việt Nam. Dataset bao gồm 8 bảng với tổng cộng 3.4 triệu records, phản ánh đầy đủ hoạt động của một sàn TMĐT từ browsing đến delivery.
ERD tổng quan
ShopVN — Star Schema
Quy mô dữ liệu
| Bảng | Số records | Mô tả |
|---|---|---|
dim_customer | 80,000 | Khách hàng trên sàn ShopVN |
dim_product | 2,000 | Sản phẩm từ 8 danh mục chính |
dim_seller | 500 | Người bán (Official Store, Mall, Standard) |
dim_time | 731 | Lịch ngày 2023-2024 (bao gồm ngày lễ) |
fact_orders | 350,000 | Đơn hàng 2 năm 2023-2024 |
fact_order_items | 850,000 | Chi tiết line items |
fact_reviews | 120,000 | Đánh giá sản phẩm (1-5 sao) |
fact_page_views | 2,000,000 | Lượt xem trang (sessions, bounces) |
Key Business Metrics trong dataset
| Metric | Giá trị | Ý nghĩa |
|---|---|---|
| Tổng doanh thu 2024 | ~500 tỷ VND | GMV sau khi trừ cancel + returns |
| AOV | ~1.4 triệu VND | Giá trị đơn hàng trung bình |
| Conversion Rate | ~3.5% | Tỷ lệ view → purchase |
| Cancel Rate | ~8% | Tỷ lệ hủy đơn hàng |
| Return Rate | ~4% | Tỷ lệ trả hàng |
| Average Rating | 4.3/5 | Đánh giá trung bình sản phẩm |
Checkpoint
ShopVN có 8 bảng theo mô hình Star Schema: 4 dimension tables (customer, product, seller, time) và 4 fact tables (orders, order_items, reviews, page_views). Tổng cộng 3.4 triệu records phản ánh hoạt động marketplace thực tế tại Việt Nam, bao gồm cả hành vi browsing (page views) và post-purchase (reviews).
🗺️ Lộ trình khóa học
Cấu trúc 12 bài học
Lộ trình 4 Module — 12 Bài học
| Module | Bài học | Nội dung chính |
|---|---|---|
| 🛒 Module 1 | Bài 1–3 | Hệ sinh thái TMĐT, Nghiệp vụ E-commerce, KPIs ngành |
| 👥 Module 2 | Bài 4–6 | Funnel Analysis, Customer Segmentation (RFM), Cohort Retention |
| 📦 Module 3 | Bài 7–9 | Product Analytics, Seller Performance, Marketing Attribution |
| 📋 Module 4 | Bài 10–12 | Review Analysis, Dashboard Design, Capstone Project |
Hoàn thành khóa học, bạn sẽ có 4 dự án portfolio ngành E-commerce:
- 📊 Conversion Funnel Dashboard — Phân tích funnel Browse → Purchase
- 👥 RFM Customer Segmentation — Phân khúc 80K khách hàng
- 🏪 Seller Performance Scorecard — Đánh giá 500 sellers
- 📋 Capstone: ShopVN Analytics Report — Báo cáo toàn diện cho CEO
📋 Tổng kết
Kiến thức đã học
| Chủ đề | Nội dung chính |
|---|---|
| Hệ sinh thái TMĐT | Marketplace vs D2C vs Social Commerce |
| Vai trò Data Analyst | Phân tích dữ liệu hỗ trợ quyết định kinh doanh E-commerce |
| Dataset ShopVN | 8 bảng Star Schema, 3.4 triệu records |
| Cấu trúc khóa học | 4 module: Nền tảng → Khách hàng → Sản phẩm → Capstone |
| Key Metrics | GMV ~500 tỷ, AOV ~1.4M, Conversion ~3.5% |
| Lộ trình học | 12 bài + 1 quiz, từ cơ bản đến dự án thực tế |
Key Takeaways
- ✅ E-commerce là ngành data-driven nhất — mọi hành vi đều được track
- ✅ Star Schema (4 dim + 4 fact) bao phủ toàn bộ customer journey
- ✅ Dataset ShopVN phản ánh hoạt động marketplace thực tế tại Việt Nam
- ✅ 4 dự án portfolio sẽ được xây dựng xuyên suốt khóa học
Câu hỏi tự kiểm tra
- Marketplace khác D2C ở điểm nào?
- Star Schema trong dataset ShopVN gồm những bảng nào?
- Conversion Rate 3.5% có nghĩa là gì?
- 4 module của khóa học bao gồm những chủ đề gì?
Bài tiếp theo: E-commerce Fundamentals →
🎉 Tuyệt vời! Bạn đã nắm được tổng quan khóa học E-commerce Analytics!
Nhớ: Hiểu rõ hệ sinh thái TMĐT và dataset ShopVN sẽ giúp bạn học hiệu quả hơn ở các bài tiếp theo!
