#DataOops

Episode 18 : DuckDB et Apache Arrow


Listen Later

DuckDB est une base de données OLAP in-process et très légère : très utile pour la préparation de données en SQL Surtout quand cette base est compilée en C++, très performante, dotée de nombreuses fonctions, capable de lire et écrire des fichiers csv ou parquet et utilisable via ODBC,JDBC, API python ou C++ ou tout simplement via CLI.
Apache Arrow est un format pour la représentation colonnaire données analytiques et permet d'éviter la serialisation et la perte de temps associée.
...more
View all episodesView all episodes
Download on the App Store

#DataOopsBy Romain Ferraton, Fabien Beaumont, Eric Duquesnoy