MinAI - Về trang chủ
🚀Trung cấpChứng chỉData WranglingBig Data

Data Wrangling & Big Data Basics

Xử lý và làm sạch dữ liệu quy mô lớn. Học Apache Spark, PySpark, SQL nâng cao, xử lý dữ liệu streaming, và thực hành với sentiment analysis trên dữ liệu mạng xã hội.

6-8 tuần

Thời gian

15

Bài học

500+

Học viên

4.9

Đánh giá

Giảng viên: MinAI Team
Cập nhật: 2026-01-04
Data Wrangling & Big Data Basics
Miễn phí

Bạn sẽ học được gì

Nắm vững kiến thức nền tảng của khóa học

Hiểu sâu lý thuyết và ứng dụng thực tế

Thực hành với các bài tập và code mẫu

Phát triển kỹ năng tư duy và giải quyết vấn đề

Áp dụng kiến thức vào dự án thực tế

Sẵn sàng cho các khóa học nâng cao

Nội dung khóa học

Nội dung khóa học

15 bài học • Tổng thời gian: 6-8 tuần

0%

0/15

Hoàn thành

1
Lý thuyết

Tổng Quan Data Wrangling & Big Data

Giới thiệu về xử lý dữ liệu quy mô lớn và công cụ Big Data

2
Lý thuyết

SQL Nâng cao

Window Functions, CTEs, Subqueries và Query Optimization

3
Lý thuyết

Pandas Nâng cao

MultiIndex, GroupBy nâng cao, Merge strategies và Performance optimization

4
Lý thuyết

Data Quality & Validation

Xử lý missing values, outliers, data validation và data profiling

5
Lý thuyết

ETL Pipelines with Python

Extract, Transform, Load pipelines - Architecture, tools và best practices

6
Lý thuyết

Apache Spark Introduction

Tổng quan Apache Spark - Architecture, components và khi nào nên dùng

7
Lý thuyết

PySpark DataFrame API

DataFrame operations, transformations và best practices trong PySpark

8
Lý thuyết

Spark SQL & Transformations

SQL queries trong Spark, Catalyst optimizer và advanced transformations

9
Lý thuyết

Spark Performance Tuning

Optimization techniques, caching, partitioning và troubleshooting Spark jobs

10
Lý thuyết

Data Streaming Fundamentals

Concepts of real-time data processing, stream processing architectures

11
Lý thuyết

Spark Structured Streaming

Real-time data processing với Spark Structured Streaming API

12
Lý thuyết

Kafka & Message Queues

Apache Kafka fundamentals, producers, consumers và integration patterns

13
Lý thuyết

Text Processing & NLP Basics

Text preprocessing, tokenization, feature extraction và NLP fundamentals

14
Lý thuyết

Project: Sentiment Analysis Pipeline

Xây dựng end-to-end sentiment analysis pipeline với real-world data

15
Quiz

Quiz tổng hợp

Kiểm tra kiến thức toàn khóa học Data Wrangling & Big Data

Công nghệ & Công cụ

Ngôn ngữ

Data Wrangling

Framework

Big Data

Công cụ

Apache SparkPySparkSQLData CleaningETLData PipelineStreamingSentiment AnalysisNLPSocial Media Data

Thông tin khóa học

15
Bài học
6-8 tuần
Thời lượng
500+
Học viên
4.9
Đánh giá

Bao gồm:

Truy cập trọn đời
Hỗ trợ 24/7
Chứng chỉ hoàn thành

Thông tin khóa học

6-8 tuần
Cấp độ: intermediate
1,000+ học viên
15 bài học

Đánh giá từ học viên

Hàng ngàn học viên đã thành công với khóa học này

"Khóa học rất chi tiết và dễ hiểu. Tôi đã áp dụng được kiến thức vào dự án thực tế ngay lập tức."

Nguyễn Văn A

Data Scientist tại FPT Software

15 tháng 1, 2024

"Giảng viên giải thích rất rõ ràng, ví dụ thực tế phong phú. Đây là khóa học tốt nhất tôi từng học."

Trần Thị B

ML Engineer tại Viettel

10 tháng 1, 2024

"Nội dung cập nhật, bài tập thực hành hay. Rất phù hợp cho người mới bắt đầu."

Lê Minh C

Data Analyst tại Vingroup

5 tháng 1, 2024

"Khóa học giúp tôi nắm vững nền tảng và tự tin hơn trong công việc. Highly recommended!"

Phạm Thị D

AI Researcher

28 tháng 12, 2023

1,000+ học viên đã đăng ký

Bắt đầu hành trình học tập của bạn ngay hôm nay

Tham gia cùng hàng ngàn học viên đã thành công với Data Wrangling & Big Data Basics. Hoàn toàn miễn phí và không giới hạn thời gian.