Introduction à Spark

Par nivdul à Nantes le 8 juillet 2014

Aujourd'hui dans l'écosystème Big Data, Hadoop et MapReduce sont largement dominants pour le traitement de données à large échelle.
Cependant le modèle MapReduce montre ses limites pour plusieurs types de traitements, notamment pour des algorithmes de Machine Learning.
Spark est un framework de traitements de données en mémoire avec un modèle de programmation plus flexible avec des performances largement meilleures.
Dans le talk, on fera une introduction de Spark, de son écosystème et de certains exemples d'utilisation.

Introduction à Spark

Commentaires