MinAI - Về trang chủ
Quiz
13/1330 phút
Đang tải...

Quiz tổng hợp

Kiểm tra kiến thức toàn khóa học GenAI RAG & Knowledge Systems

0

🎯 Mục tiêu bài Quiz

TB5 min

Kiểm tra kiến thức của bạn qua các câu hỏi trắc nghiệm và bài tập thực hành!

✅ 18 câu hỏi trắc nghiệm (6 phần)

✅ 3 bài tập thực hành

✅ Yêu cầu: Hoàn thành bài 1-12

Thời gian: 30 phút | Độ khó: Tổng hợp | Đạt yêu cầu: ≥ 13/18 câu đúng

1

Phần 1: RAG Architecture

TB5 min
2

Phần 2: Vector Database & Embeddings

TB5 min
3

Phần 3: Chunking & Document Processing

TB5 min
4

Phần 4: Retrieval Methods

TB5 min
5

Phần 5: LangChain RAG

TB5 min
6

Phần 6: Production & Evaluation

TB5 min
7

Phần 7: Bài tập thực hành

TB5 min

Bài tập 1: Xây dựng RAG Pipeline hoàn chỉnh

Yêu cầu: Sử dụng LangChain để xây dựng pipeline RAG end-to-end với tài liệu tiếng Việt.

Các bước thực hiện:

  1. Chuẩn bị tài liệu: sử dụng Document Loaders để load ít nhất 3 file PDF/TXT tiếng Việt
  2. Chunking: áp dụng RecursiveCharacterTextSplitter với chunk_size=500, chunk_overlap=50 — thử nghiệm thêm 2 cấu hình khác và so sánh
  3. Embeddings: tạo embeddings bằng OpenAI (text-embedding-3-small) hoặc sentence-transformers (all-MiniLM-L6-v2)
  4. Vector Store: lưu vào FAISS hoặc Chroma, thực hiện similarity search và MMR search
  5. RetrievalQA Chain: xây dựng chain kết nối retriever → prompt → LLM → output
  6. Kiểm thử với ít nhất 5 câu hỏi, ghi nhận source documents trả về

Output mong đợi: Pipeline hoạt động hoàn chỉnh, trả lời chính xác dựa trên nội dung tài liệu, có so sánh chunking strategies.

Bài tập 2: Đánh giá và tối ưu RAG System

Yêu cầu: Đánh giá chất lượng RAG system bằng RAGAS framework và tối ưu hóa hiệu năng.

Các bước thực hiện:

  1. Tạo bộ evaluation dataset: ít nhất 10 cặp (question, ground_truth_answer) từ tài liệu
  2. Chạy RAG pipeline và thu thập kết quả: answer, source contexts
  3. Đánh giá bằng RAGAS: tính Faithfulness, Answer Relevancy, Context Precision, Context Recall
  4. Phân tích kết quả: xác định câu hỏi nào RAG trả lời kém và nguyên nhân
  5. Tối ưu: thử thay đổi chunk_size, top_k, embedding model, thêm re-ranking — đo lại metrics
  6. So sánh kết quả trước và sau tối ưu

Output mong đợi: Báo cáo đánh giá với RAGAS metrics, phân tích chi tiết, cải thiện ít nhất 10% sau tối ưu.

Bài tập 3: Xây dựng Conversational RAG Chatbot với Advanced Techniques

Yêu cầu: Xây dựng chatbot RAG nâng cao với multi-query retrieval, re-ranking, và conversation memory.

Các bước thực hiện:

  1. Xây dựng knowledge base: index ít nhất 50 trang tài liệu vào vector store
  2. Triển khai multi-query retriever: LLM sinh 3 biến thể của câu hỏi gốc để retrieve đa dạng hơn
  3. Thêm re-ranking: sử dụng cross-encoder để sắp xếp lại kết quả retrieval
  4. Tích hợp ConversationBufferMemory: chatbot nhớ lịch sử 10 lượt hội thoại gần nhất
  5. Xử lý edge cases: câu hỏi ngoài phạm vi tài liệu, câu hỏi mơ hồ, câu hỏi follow-up
  6. Kiểm thử hội thoại nhiều lượt: ít nhất 10 câu hỏi liên tiếp với câu hỏi follow-up

Output mong đợi: Chatbot trả lời chính xác, duy trì ngữ cảnh hội thoại, xử lý edge cases phù hợp, có re-ranking cải thiện quality.

8

📊 Đánh giá kết quả

TB5 min
Số câu đúngĐánh giá
16-18🌟 Xuất sắc! Bạn nắm vững kiến thức
13-15👍 Tốt! Cần ôn lại một số chủ đề
9-12📚 Cần học thêm, xem lại các bài
dưới 9🔄 Nên học lại từ đầu
9

🎓 Hoàn thành khóa học!

TB5 min

Câu hỏi tự kiểm tra

  1. Giải thích pipeline RAG và so sánh RAG vs fine-tuning khi cần cập nhật kiến thức cho LLM?
  2. Tại sao chunking strategy ảnh hưởng đến chất lượng retrieval trong RAG?
  3. So sánh Similarity Search, MMR, và Hybrid Search — khi nào dùng phương pháp nào?
  4. RAGAS framework đánh giá RAG system dựa trên những metrics nào và ý nghĩa của từng metric?

🎉 Tuyệt vời! Bạn đã hoàn thành toàn bộ khóa học GenAI RAG & Knowledge Systems!

Tóm tắt kiến thức đã học:

  • RAG Architecture: Pipeline retrieval-augmented generation, so sánh RAG vs fine-tuning
  • Vector Databases: Pinecone, Chroma, Weaviate, FAISS — lưu trữ và truy vấn embeddings
  • Embeddings: OpenAI, Cohere, sentence-transformers — biểu diễn ngữ nghĩa, cosine similarity
  • Chunking Strategies: Fixed-size, Recursive, Semantic chunking — overlap và tối ưu kích thước
  • Retrieval Methods: Similarity search, MMR, Hybrid search, Re-ranking
  • LangChain RAG: RetrievalQA, ConversationalRetrievalChain, LCEL
  • Evaluation: RAGAS framework — Faithfulness, Relevancy, Context Precision & Recall
  • Production RAG: Caching, monitoring, scaling, error handling
  • Advanced RAG: Query transformation, multi-query, HyDE, routing, multi-index

Bước tiếp theo: Áp dụng kiến thức RAG vào dự án thực tế — xây dựng một hệ thống knowledge base thông minh cho doanh nghiệp, hỗ trợ tìm kiếm và trả lời câu hỏi trên tài liệu nội bộ!