🎯 Mục tiêu bài Quiz
Kiểm tra kiến thức của bạn qua các câu hỏi trắc nghiệm và bài tập thực hành!
✅ 18 câu hỏi trắc nghiệm (6 phần)
✅ 3 bài tập thực hành
✅ Yêu cầu: Hoàn thành bài 1-12
Thời gian: 30 phút | Độ khó: Tổng hợp | Đạt yêu cầu: ≥ 13/18 câu đúng
Phần 1: RAG Architecture
Phần 2: Vector Database & Embeddings
Phần 3: Chunking & Document Processing
Phần 4: Retrieval Methods
Phần 5: LangChain RAG
Phần 6: Production & Evaluation
Phần 7: Bài tập thực hành
Bài tập 1: Xây dựng RAG Pipeline hoàn chỉnh
Yêu cầu: Sử dụng LangChain để xây dựng pipeline RAG end-to-end với tài liệu tiếng Việt.
Các bước thực hiện:
- Chuẩn bị tài liệu: sử dụng Document Loaders để load ít nhất 3 file PDF/TXT tiếng Việt
- Chunking: áp dụng RecursiveCharacterTextSplitter với chunk_size=500, chunk_overlap=50 — thử nghiệm thêm 2 cấu hình khác và so sánh
- Embeddings: tạo embeddings bằng OpenAI (text-embedding-3-small) hoặc sentence-transformers (all-MiniLM-L6-v2)
- Vector Store: lưu vào FAISS hoặc Chroma, thực hiện similarity search và MMR search
- RetrievalQA Chain: xây dựng chain kết nối retriever → prompt → LLM → output
- Kiểm thử với ít nhất 5 câu hỏi, ghi nhận source documents trả về
Output mong đợi: Pipeline hoạt động hoàn chỉnh, trả lời chính xác dựa trên nội dung tài liệu, có so sánh chunking strategies.
Bài tập 2: Đánh giá và tối ưu RAG System
Yêu cầu: Đánh giá chất lượng RAG system bằng RAGAS framework và tối ưu hóa hiệu năng.
Các bước thực hiện:
- Tạo bộ evaluation dataset: ít nhất 10 cặp (question, ground_truth_answer) từ tài liệu
- Chạy RAG pipeline và thu thập kết quả: answer, source contexts
- Đánh giá bằng RAGAS: tính Faithfulness, Answer Relevancy, Context Precision, Context Recall
- Phân tích kết quả: xác định câu hỏi nào RAG trả lời kém và nguyên nhân
- Tối ưu: thử thay đổi chunk_size, top_k, embedding model, thêm re-ranking — đo lại metrics
- So sánh kết quả trước và sau tối ưu
Output mong đợi: Báo cáo đánh giá với RAGAS metrics, phân tích chi tiết, cải thiện ít nhất 10% sau tối ưu.
Bài tập 3: Xây dựng Conversational RAG Chatbot với Advanced Techniques
Yêu cầu: Xây dựng chatbot RAG nâng cao với multi-query retrieval, re-ranking, và conversation memory.
Các bước thực hiện:
- Xây dựng knowledge base: index ít nhất 50 trang tài liệu vào vector store
- Triển khai multi-query retriever: LLM sinh 3 biến thể của câu hỏi gốc để retrieve đa dạng hơn
- Thêm re-ranking: sử dụng cross-encoder để sắp xếp lại kết quả retrieval
- Tích hợp ConversationBufferMemory: chatbot nhớ lịch sử 10 lượt hội thoại gần nhất
- Xử lý edge cases: câu hỏi ngoài phạm vi tài liệu, câu hỏi mơ hồ, câu hỏi follow-up
- Kiểm thử hội thoại nhiều lượt: ít nhất 10 câu hỏi liên tiếp với câu hỏi follow-up
Output mong đợi: Chatbot trả lời chính xác, duy trì ngữ cảnh hội thoại, xử lý edge cases phù hợp, có re-ranking cải thiện quality.
📊 Đánh giá kết quả
| Số câu đúng | Đánh giá |
|---|---|
| 16-18 | 🌟 Xuất sắc! Bạn nắm vững kiến thức |
| 13-15 | 👍 Tốt! Cần ôn lại một số chủ đề |
| 9-12 | 📚 Cần học thêm, xem lại các bài |
| dưới 9 | 🔄 Nên học lại từ đầu |
🎓 Hoàn thành khóa học!
Câu hỏi tự kiểm tra
- Giải thích pipeline RAG và so sánh RAG vs fine-tuning khi cần cập nhật kiến thức cho LLM?
- Tại sao chunking strategy ảnh hưởng đến chất lượng retrieval trong RAG?
- So sánh Similarity Search, MMR, và Hybrid Search — khi nào dùng phương pháp nào?
- RAGAS framework đánh giá RAG system dựa trên những metrics nào và ý nghĩa của từng metric?
🎉 Tuyệt vời! Bạn đã hoàn thành toàn bộ khóa học GenAI RAG & Knowledge Systems!
Tóm tắt kiến thức đã học:
- RAG Architecture: Pipeline retrieval-augmented generation, so sánh RAG vs fine-tuning
- Vector Databases: Pinecone, Chroma, Weaviate, FAISS — lưu trữ và truy vấn embeddings
- Embeddings: OpenAI, Cohere, sentence-transformers — biểu diễn ngữ nghĩa, cosine similarity
- Chunking Strategies: Fixed-size, Recursive, Semantic chunking — overlap và tối ưu kích thước
- Retrieval Methods: Similarity search, MMR, Hybrid search, Re-ranking
- LangChain RAG: RetrievalQA, ConversationalRetrievalChain, LCEL
- Evaluation: RAGAS framework — Faithfulness, Relevancy, Context Precision & Recall
- Production RAG: Caching, monitoring, scaling, error handling
- Advanced RAG: Query transformation, multi-query, HyDE, routing, multi-index
Bước tiếp theo: Áp dụng kiến thức RAG vào dự án thực tế — xây dựng một hệ thống knowledge base thông minh cho doanh nghiệp, hỗ trợ tìm kiếm và trả lời câu hỏi trên tài liệu nội bộ!
