Vaex est une bibliothèque Python hautes performances pour les DataFrames Out-of-Core paresseux (similaires aux Pandas), permettant de visualiser et d'explorer de grands ensembles de données tabulaires. Il calcule des statistiques telles que la moyenne, la somme, le nombre, l'écart type, etc., sur une grille à N dimensions pour plus d' un milliard ( 10^9
) d'échantillons/lignes par seconde . La visualisation se fait à l'aide d'histogrammes , de tracés de densité et de rendu de volume 3D , permettant une exploration interactive du big data. Vaex utilise le mappage de mémoire, une politique de copie de mémoire nulle et des calculs paresseux pour de meilleures performances (pas de perte de mémoire).
Avec pépin :
$ pip install vaex
Ou conda :
$ conda install -c conda-forge vaex
Pour plus de détails, consultez la documentation
HDF5 et Apache Arrow pris en charge.
Lisez la documentation pour savoir comment convertir efficacement vos données à partir de fichiers CSV, Pandas DataFrames ou d'autres sources.
Streaming paresseux à partir de S3 pris en charge en combinaison avec le mappage de mémoire.
Ne perdez pas de mémoire ni de temps avec l'ingénierie des fonctionnalités, nous transformons (paresseusement) vos données en cas de besoin.
Le filtrage et l'évaluation des expressions ne gaspilleront pas de mémoire en effectuant des copies ; les données restent intactes sur le disque et ne seront diffusées qu'en cas de besoin. Retardez le temps avant d’avoir besoin d’un cluster.
Vaex implémente des opérations groupby
parallélisées et hautement performantes, en particulier lors de l'utilisation de catégories (> 1 milliard/seconde).
Vaex ne copie/matérialise pas la « bonne » table lors de la jointure, économisant ainsi des gigaoctets de mémoire. Avec une jonction en une seconde sur un milliard de lignes, c'est assez rapide !
Voir la page de contribution.
Rejoignez la discussion sur notre chaîne Slack !
Articles
Suivez nos tutoriels
Regardez nos discussions les plus récentes :
Contactez-nous pour des solutions de science des données, une formation ou une assistance aux entreprises sur https://vaex.io/