🚀Trung cấpChứng chỉData WranglingBig Data

Data Wrangling & Big Data Basics

Xử lý và làm sạch dữ liệu quy mô lớn. Học Apache Spark, PySpark, SQL nâng cao, xử lý dữ liệu streaming, và thực hành với sentiment analysis trên dữ liệu mạng xã hội.

6-8 tuần

Thời gian

15

Bài học

500+

Học viên

4.9

Đánh giá

Giảng viên: MinAI Team
Cập nhật: 2026-01-04
Data Wrangling & Big Data Basics
Miễn phí

Bạn sẽ học được gì

Nắm vững kiến thức nền tảng của khóa học

Hiểu sâu lý thuyết và ứng dụng thực tế

Thực hành với các bài tập và code mẫu

Phát triển kỹ năng tư duy và giải quyết vấn đề

Áp dụng kiến thức vào dự án thực tế

Sẵn sàng cho các khóa học nâng cao

Nội dung khóa học

15 bài học • Tổng thời gian: 6-8 tuần

0%

0/15

Hoàn thành

1
Lý thuyết

Tổng Quan Data Wrangling & Big Data

Giới thiệu về xử lý dữ liệu quy mô lớn và công cụ Big Data

2
Lý thuyết

SQL Nâng cao

Window Functions, CTEs, Subqueries và Query Optimization

3
Lý thuyết

Pandas Nâng cao

MultiIndex, GroupBy nâng cao, Merge strategies và Performance optimization

4
Lý thuyết

Data Quality & Validation

Xử lý missing values, outliers, data validation và data profiling

5
Lý thuyết

ETL Pipelines with Python

Extract, Transform, Load pipelines - Architecture, tools và best practices

6
Lý thuyết

Apache Spark Introduction

Tổng quan Apache Spark - Architecture, components và khi nào nên dùng

7
Lý thuyết

PySpark DataFrame API

DataFrame operations, transformations và best practices trong PySpark

8
Lý thuyết

Spark SQL & Transformations

SQL queries trong Spark, Catalyst optimizer và advanced transformations

9
Lý thuyết

Spark Performance Tuning

Optimization techniques, caching, partitioning và troubleshooting Spark jobs

10
Lý thuyết

Data Streaming Fundamentals

Concepts of real-time data processing, stream processing architectures

11
Lý thuyết

Spark Structured Streaming

Real-time data processing với Spark Structured Streaming API

12
Lý thuyết

Kafka & Message Queues

Apache Kafka fundamentals, producers, consumers và integration patterns

13
Lý thuyết

Text Processing & NLP Basics

Text preprocessing, tokenization, feature extraction và NLP fundamentals

14
Lý thuyết

Project: Sentiment Analysis Pipeline

Xây dựng end-to-end sentiment analysis pipeline với real-world data

15
Lý thuyết

Data Wrangling & Big Data Basics

Xử lý và làm sạch dữ liệu quy mô lớn

Thông tin khóa học

15
Bài học
6-8 tuần
Thời lượng
500+
Học viên
4.9
Đánh giá

Bao gồm:

Truy cập trọn đời
Hỗ trợ 24/7
Chứng chỉ hoàn thành
500+ học viên đã đăng ký

Sẵn sàng chinh phục Data Wrangling & Big Data Basics?

Bắt đầu hành trình học tập của bạn ngay hôm nay. Hoàn toàn miễn phí và không giới hạn thời gian.

Bắt đầu học miễn phí