Data Wrangling & Big Data Basics
Xử lý và làm sạch dữ liệu quy mô lớn. Học Apache Spark, PySpark, SQL nâng cao, xử lý dữ liệu streaming, và thực hành với sentiment analysis trên dữ liệu mạng xã hội.
6-8 tuần
Thời gian
15
Bài học
500+
Học viên
4.9
Đánh giá
Bạn sẽ học được gì
Nắm vững kiến thức nền tảng của khóa học
Hiểu sâu lý thuyết và ứng dụng thực tế
Thực hành với các bài tập và code mẫu
Phát triển kỹ năng tư duy và giải quyết vấn đề
Áp dụng kiến thức vào dự án thực tế
Sẵn sàng cho các khóa học nâng cao
Nội dung khóa học
Nội dung khóa học
15 bài học • Tổng thời gian: 6-8 tuần
0/15
Hoàn thành
Tổng Quan Data Wrangling & Big Data
Giới thiệu về xử lý dữ liệu quy mô lớn và công cụ Big Data
SQL Nâng cao
Window Functions, CTEs, Subqueries và Query Optimization
Pandas Nâng cao
MultiIndex, GroupBy nâng cao, Merge strategies và Performance optimization
Data Quality & Validation
Xử lý missing values, outliers, data validation và data profiling
ETL Pipelines with Python
Extract, Transform, Load pipelines - Architecture, tools và best practices
Apache Spark Introduction
Tổng quan Apache Spark - Architecture, components và khi nào nên dùng
PySpark DataFrame API
DataFrame operations, transformations và best practices trong PySpark
Spark SQL & Transformations
SQL queries trong Spark, Catalyst optimizer và advanced transformations
Spark Performance Tuning
Optimization techniques, caching, partitioning và troubleshooting Spark jobs
Data Streaming Fundamentals
Concepts of real-time data processing, stream processing architectures
Spark Structured Streaming
Real-time data processing với Spark Structured Streaming API
Kafka & Message Queues
Apache Kafka fundamentals, producers, consumers và integration patterns
Text Processing & NLP Basics
Text preprocessing, tokenization, feature extraction và NLP fundamentals
Project: Sentiment Analysis Pipeline
Xây dựng end-to-end sentiment analysis pipeline với real-world data
Quiz tổng hợp
Kiểm tra kiến thức toàn khóa học Data Wrangling & Big Data
Công nghệ & Công cụ
Ngôn ngữ
Framework
Công cụ
Thông tin khóa học
Bao gồm:
Thông tin khóa học
Yêu cầu trước khi học
Đánh giá từ học viên
Hàng ngàn học viên đã thành công với khóa học này
"Khóa học rất chi tiết và dễ hiểu. Tôi đã áp dụng được kiến thức vào dự án thực tế ngay lập tức."
Nguyễn Văn A
Data Scientist tại FPT Software
15 tháng 1, 2024
"Giảng viên giải thích rất rõ ràng, ví dụ thực tế phong phú. Đây là khóa học tốt nhất tôi từng học."
Trần Thị B
ML Engineer tại Viettel
10 tháng 1, 2024
"Nội dung cập nhật, bài tập thực hành hay. Rất phù hợp cho người mới bắt đầu."
Lê Minh C
Data Analyst tại Vingroup
5 tháng 1, 2024
"Khóa học giúp tôi nắm vững nền tảng và tự tin hơn trong công việc. Highly recommended!"
Phạm Thị D
AI Researcher
28 tháng 12, 2023
Bắt đầu hành trình học tập của bạn ngay hôm nay
Tham gia cùng hàng ngàn học viên đã thành công với Data Wrangling & Big Data Basics. Hoàn toàn miễn phí và không giới hạn thời gian.
