Gestion d'un projet Big-Data
On parle aujourd'hui de plus en plus du Big-Data, où l'avalanche de données issues de sources multiples et variées. Ce talk cherche à répondre à une question sur le mouvement, qui est, non pas pour une fois, d'où viennent ces données (logs, capteurs de données, tickets de caisse) ni quels sont les usages (aussi divers que variés dans le domaine de la vente, de la sécurité, de la santé...) mais plutôt comment on fait un projet Big-Data. Seront présentés quels sont les outils utilisables (Technos Cloud, Flask, Python, Hadoop, D3...) ainsi que les grandes étapes de réalisation d'un projet :
- récupération des données
- stockage des données
- nettoyage et enrichissement des données
- analyse des données
- visualisation des données.
Commentaires