Gimme Data! Moar! Défis et pistes pour la récupération de gros volumes de données
Nous générons toujours plus de données, c'est un fait. Nous en analysons toujours plus aussi... Mais concrêtement, comment récupère-t-on les données avant de passer au traitement ?
Le projet sample.cat vise à analyser des millions de tweets pour en extraire des marqueurs sociaux. Le premier défi tient dans la récupération de ces millions de petits message et leur méta-données. Parlons en.
Commentaires