Data Engineering від А до Я

Ingest with Python — pandas та PySpark у data pipelines


Listen Later

Цей випуск завершує серію про ingestion-методи. Говоримо про два популярних інструменти з Python-екосистеми — pandas та PySpark.
Коли варто використовувати кожен? Як зчитувати, обробляти і завантажувати дані з CSV, BigQuery або DataFrame-структури? Чим відрізняються RDD, DataFrame і Dataset у Spark?

Щоб не пропустити нові епізоди — підпишіться на подкаст ✨

...more
View all episodesView all episodes
Download on the App Store

Data Engineering від А до ЯBy Data Enthusiast FM