Par damio à Compiègne le 9 juin 2015

Beaucoup d'infos sont disponibles sur internet que l'on aurait envie de récupérer pour les traitées ensuite:

  • les horaires de bus
  • les critiques de films
  • ses mails
  • ...

On appelle celà du scrapping

Ici je vais vous présenter comment le faire concrétement avec Python et quelques bibliothéques sympa:

  • requests pour faire des requétes web simple (GET, POST,..)
  • BeautifulSoup pour analyser le HTML et en extraire les infos
  • selenium pour diriger directement un vrai naviguateur

Et la je fait appel à vous! Dites-moi ce que vous voulez que scrape!

Exemples: Notes de cours, commentaires de vidéo youtube, photos facebook, cours de moodle, ....

Slides

Commentaires