Quiz tổng hợp

🎯 Mục tiêu bài Quiz

TB5 min

Kiểm tra kiến thức của bạn qua các câu hỏi trắc nghiệm và bài tập thực hành!

✅ 18 câu hỏi trắc nghiệm (6 phần)

✅ 3 bài tập thực hành

✅ Yêu cầu: Hoàn thành bài 1-12

Thời gian: 30 phút | Độ khó: Tổng hợp | Đạt yêu cầu: ≥ 13/18 câu đúng

Task 0

Phần 1: RAG Architecture

TB5 min

Task 1

Phần 2: Vector Database & Embeddings

TB5 min

Task 2

Phần 3: Chunking & Document Processing

TB5 min

Task 3

Phần 4: Retrieval Methods

TB5 min

Task 4

Phần 5: LangChain RAG

TB5 min

Task 5

Phần 6: Production & Evaluation

TB5 min

Task 6

Phần 7: Bài tập thực hành

TB5 min

Bài tập 1: Xây dựng RAG Pipeline hoàn chỉnh

Yêu cầu: Sử dụng LangChain để xây dựng pipeline RAG end-to-end với tài liệu tiếng Việt.

Các bước thực hiện:

Chuẩn bị tài liệu: sử dụng Document Loaders để load ít nhất 3 file PDF/TXT tiếng Việt
Chunking: áp dụng RecursiveCharacterTextSplitter với chunk_size=500, chunk_overlap=50 — thử nghiệm thêm 2 cấu hình khác và so sánh
Embeddings: tạo embeddings bằng OpenAI (text-embedding-3-small) hoặc sentence-transformers (all-MiniLM-L6-v2)
Vector Store: lưu vào FAISS hoặc Chroma, thực hiện similarity search và MMR search
RetrievalQA Chain: xây dựng chain kết nối retriever → prompt → LLM → output
Kiểm thử với ít nhất 5 câu hỏi, ghi nhận source documents trả về

Output mong đợi: Pipeline hoạt động hoàn chỉnh, trả lời chính xác dựa trên nội dung tài liệu, có so sánh chunking strategies.

Bài tập 2: Đánh giá và tối ưu RAG System

Yêu cầu: Đánh giá chất lượng RAG system bằng RAGAS framework và tối ưu hóa hiệu năng.

Các bước thực hiện:

Tạo bộ evaluation dataset: ít nhất 10 cặp (question, ground_truth_answer) từ tài liệu
Chạy RAG pipeline và thu thập kết quả: answer, source contexts
Đánh giá bằng RAGAS: tính Faithfulness, Answer Relevancy, Context Precision, Context Recall
Phân tích kết quả: xác định câu hỏi nào RAG trả lời kém và nguyên nhân
Tối ưu: thử thay đổi chunk_size, top_k, embedding model, thêm re-ranking — đo lại metrics
So sánh kết quả trước và sau tối ưu

Output mong đợi: Báo cáo đánh giá với RAGAS metrics, phân tích chi tiết, cải thiện ít nhất 10% sau tối ưu.

Bài tập 3: Xây dựng Conversational RAG Chatbot với Advanced Techniques

Yêu cầu: Xây dựng chatbot RAG nâng cao với multi-query retrieval, re-ranking, và conversation memory.

Các bước thực hiện:

Xây dựng knowledge base: index ít nhất 50 trang tài liệu vào vector store
Triển khai multi-query retriever: LLM sinh 3 biến thể của câu hỏi gốc để retrieve đa dạng hơn
Thêm re-ranking: sử dụng cross-encoder để sắp xếp lại kết quả retrieval
Tích hợp ConversationBufferMemory: chatbot nhớ lịch sử 10 lượt hội thoại gần nhất
Xử lý edge cases: câu hỏi ngoài phạm vi tài liệu, câu hỏi mơ hồ, câu hỏi follow-up
Kiểm thử hội thoại nhiều lượt: ít nhất 10 câu hỏi liên tiếp với câu hỏi follow-up

Output mong đợi: Chatbot trả lời chính xác, duy trì ngữ cảnh hội thoại, xử lý edge cases phù hợp, có re-ranking cải thiện quality.

Task 7

📊 Đánh giá kết quả

TB5 min

Số câu đúng	Đánh giá
16-18	🌟 Xuất sắc! Bạn nắm vững kiến thức
13-15	👍 Tốt! Cần ôn lại một số chủ đề
9-12	📚 Cần học thêm, xem lại các bài
dưới 9	🔄 Nên học lại từ đầu

Task 8

🎓 Hoàn thành khóa học!

TB5 min

Câu hỏi tự kiểm tra

Giải thích pipeline RAG và so sánh RAG vs fine-tuning khi cần cập nhật kiến thức cho LLM?
Tại sao chunking strategy ảnh hưởng đến chất lượng retrieval trong RAG?
So sánh Similarity Search, MMR, và Hybrid Search — khi nào dùng phương pháp nào?
RAGAS framework đánh giá RAG system dựa trên những metrics nào và ý nghĩa của từng metric?

🎉 Tuyệt vời! Bạn đã hoàn thành toàn bộ khóa học GenAI RAG & Knowledge Systems!

Tóm tắt kiến thức đã học:

RAG Architecture: Pipeline retrieval-augmented generation, so sánh RAG vs fine-tuning
Vector Databases: Pinecone, Chroma, Weaviate, FAISS — lưu trữ và truy vấn embeddings
Embeddings: OpenAI, Cohere, sentence-transformers — biểu diễn ngữ nghĩa, cosine similarity
Chunking Strategies: Fixed-size, Recursive, Semantic chunking — overlap và tối ưu kích thước
Retrieval Methods: Similarity search, MMR, Hybrid search, Re-ranking
LangChain RAG: RetrievalQA, ConversationalRetrievalChain, LCEL
Evaluation: RAGAS framework — Faithfulness, Relevancy, Context Precision & Recall
Production RAG: Caching, monitoring, scaling, error handling
Advanced RAG: Query transformation, multi-query, HyDE, routing, multi-index

Bước tiếp theo: Áp dụng kiến thức RAG vào dự án thực tế — xây dựng một hệ thống knowledge base thông minh cho doanh nghiệp, hỗ trợ tìm kiếm và trả lời câu hỏi trên tài liệu nội bộ!

Task 9

🎯 Mục tiêu bài Quiz

Phần 1: RAG Architecture

Phần 2: Vector Database & Embeddings

Phần 3: Chunking & Document Processing

Phần 4: Retrieval Methods

Phần 5: LangChain RAG

Phần 6: Production & Evaluation

Phần 7: Bài tập thực hành

Bài tập 1: Xây dựng RAG Pipeline hoàn chỉnh

Bài tập 2: Đánh giá và tối ưu RAG System

Bài tập 3: Xây dựng Conversational RAG Chatbot với Advanced Techniques

📊 Đánh giá kết quả

🎓 Hoàn thành khóa học!

Câu hỏi tự kiểm tra

Khóa học

Mentor & Hỗ trợ

Blog

Giới thiệu